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1 INLEIDING 


Een informatiesysteem zullen vve omschriyven als het geheel van 
activiteiten, hulpmiddelen en methoden vvaarmee een organisatie 

aan ziin informatiebehoefte tracht te voldoen. 

In informatiesystemen moeten grote hoeveelheden gegevens opgesla- 
gen, vervverkt en opgezocht vvorden. Deze gegevens beschriyven ob- 
iecten (begrip, betekenisvolle eenheid), (personen, goederen, pro- 
iecten e.d. ), die in een organisatie aanvvezig ziyn. Van deze ob?ecten 
vrorden alleen de kenmerken beschreven die voor het functioneren 
van de organisatie van belang ziin. Biyvoorbeeld: ob)ect: persoon, 
kenmerken: naam, adres, leeftifd. 

In deze syllabus zullen vve zien hoe deze opslag van gegevens kan 
geschieden, daarbi) zovvel het gevvenste gebruik van de gegevens 
(toegankeliikheid) als de huidige opslagmogeliy)kheden beschouvvend. 
Tevens zullen vve enige aandacht schenken aan de samenhang, struc- 
tuur van gegevensverzamelingen. 

Belangriik is het dan een onderscheid te maken tussen de informa- 
tiestructuur, de logische structuur die de samenhang van de ge- 
gevensverzameling beschriifft en de fysieke of opslagstructuur, 
v.aarin vastgelegd is hoe een bepaalde 1logische structuur afgebeeld 
is op beschikbare geheugensystemen. 

De logische structuur is een gegeven dat vanuit de probleemstelling 
en probleemanalyse naar voren komt (personen veerken in een 
afdeling, een artikel is een onderdeel van een samengesteld 
artikel etc). 

De fysieke structuur vvordt zodanig ontvvorpen of - als standaard 
softvvare beschikbaar is - gekozen dat de logische structuur efficiönt 
op de beschikbare achtergrondgeheugens afgebeeld vvordt. De over- 
vvegingen die bi) dit proces een rol spelen ziin voornameliiyk: zuinig 
geheugengebruik en snelle toegankeliykheid. 

Bi) het programmeren van informatievervverkende processen poogt 
men thans steeds meer de fysieke structuur niet in het progxramma 
door te laten dringen. De logische structuur is een onderdeel van de 
probleemoplossing en is dan ook vervveven in het programma. Doel 
van dit streven is de programmeur te ontlasten van bestandsorgani- 
satie-trucs en de programma"s onafhankelifik te maken van de fysieke 
eigenschappen van dit ene computersysteem. 


Bi) programmeertalen als Cobol en Fortran treft men nog vel ele- 
menten van de fysieke structuur in de programmatekst aan, alhoe- 
vvel men er naar streeft de gekozen opslagstructuur zoveel mogeliik 
vast te leggen in de "karvveibesturingstaal". 

Bi) data base management systemen (Mark IV, Infol, TDMS) ziin 
opslagstructuur en logische structuur vvel volledig gescheiden. 


In deze syllabus zullen achtereenvolgens aan de orde komen: basis- 
begrippen, enkele logische en fysieke structuren, opslagmedia en 
veel gebruikte opslagstructuren, bestandsontvverp en data base 
management systemen. 


2 ENKELE BASISBEGRIPPEN 


2.1 Xarakters 


De kleinste lo gisc he bouvvstenen voor informatievastlegging zullen 
voor ons karakters ziin, dat vil zeggen de letters van een alfabet, de 
ciffersymbolen 0-9 en een hier niet nader bepaald aantal "speciale" 
karakters als leestekens, rekenkundige symbolen enz. De afbeelding 
van deze bouvvstenen op de kleinste fysieke bouvvstenen, te vveten 
bits zal niet aan de orde komen, behoudens de vaststelling dat voor 
de afbeelding van ieder karakter een vast aantal bits (meestal 6 of 8 
bits, samen byte te noemen) nodig is. 


2.2 1tems 


Met deze bouvvstenen kunnen vve de voor een probleem relevante, 1o- 
gische informatie-eenheden of items opbouvven en vel de naam 
van een item en de vaarde van een item ("value", gegevens- 
vvaarde). Afhankeliik van de aard van het item kan de vvaarde nume- 
riek (een getal) ziin, of alfabetisch (een naam of vvoonplaats) of alfa- 
numeriek (een codevvoord samengesteld uit letters en ci/fers). De 
naam van een item (attribuut, gegevensklasse, property1) 
vvordt veelal niet expliciet vastgelegd en, indien dit vvel het geval is, 
meestal met letters alleen. Het vastleggen van itemvvaarden alleen 
(een "homogene" informatieverzameling) impliceert een stilzvviigende 
afspraak over de volgorde van items en vereist de aanvvezigheid van 
een speciale "nulvvaarde" (blank) om aan te kunnen geven dat een be- 
paald gegeven niet bekend is. Voor de fysieke vastlegging van een 
item in een veld (rubriek, "field") kan enige conversie van de ex- 
terne representatie plaatsvinden, zo vvorden decimale getallen veelal 
binair in de machine vastgelegd, de nog gebruikeliike datumschriif- 
VVİİze vvordt geconverteerd naar de voor vergeliyiking handiger (en 
sinds kort genormaliseerde) representatie faar-maand-dag, een vol- 
ledige tekst vvordt misschien gecomprimeerd door invoering van 
afkortingen of vveglating van klinkers enz. Deze conversieproblemen 
zullen hier echter niet besproken vvorden, De le ng te van een item 
is het aantal karakters, vvaaruit ziin fysieke vastlegging bestaat. 
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2.3 Records 


De een bepaald verband hebbende items vvorden als regel verzameld 
tot een zogenaamd recordtype, bi)voorbeeld omdat het gegevens ziin 
die betrekking hebben op eenzelfde persoon of eenzelfde apparaat of 
eenzelfde complex van activiteiten ("entity" of "obiect"). Is de naam 
van de entity expliciet in het record opgenomen, dan heet dit centrale 
item meestal sleutelitem of recordsleutel, de vvaarde van het sleutel- 
item heet de sleutel ("key") omdat dit gegeven als het vvare de 
toegang geeft tot andere bi? de entity horende gegevens. Soms ziyn 
meer sleutels nodig om een record €enduidig te bepalen (vergeliik 
het doel van naam, voorletters, geboortedatum). 

Voorbeeld: Bi? een personeelsafdeling vvorden over personeelsleden 
("entities" of "obiects") de volgende gegevens (attributes, properties, 
eigenschappen die het obiect kenmerken) bevvaard: 


entity : personeelslid 
properties: naam, adres, afdeling, aantal kinderen 
values : 1ansen, dam 18 amsterdam, magaziiln, 3. 


Hierbi) zi) opgemerkt dat de entity of het recordtype "personeelslid" 
is en dat de verzameling values ook vvel aangeduid vvordt als het 
record of het logical record. Afhankelifk van het resultaat van de 
bestudering van een probleem kan men besluiten tot het ene uiterste, 
nameliik om alle items behorende bi? een sleutelitem in €en record 
te plaatsen (dat dan vvel erg groot kan vvorden) of tot het andere 
uiterste, nameliik een groot aantal records slechts bestaande uit 
het sleutelitem en telkens €en ander item, of tot een oplossing tus- 
sen deze tvvee uitersten. Een bepaald gegeven bii een zeker item 
zal dan meestal via de sleutel in €en van de records gezocht moeten 
vvorden. Het is echter ook mogeliyk dat het gevonden moet vvorden 
via een vervviizing (viizer, "pointer, reference") in 6en van deze 
records (vergeliik de situatie in onze telefoongidsen, vvaarin vve 
Bouvv- en VVoningtoezicht vinden via Gemeenteliike Instellingen). 


De fysieke vastlegging van logical records gebeurt door "blokken" 
van een aantal logical records tot een blok (physical record). Dit in 
verband met de efficiöntie van het gebruik van secundaire geheugen- 
systemen, zoals vve verderop zullen zien. Blokken vvorden met 6en 
invoer- of uitvoeropdracht gelezen öf geschreven (dit is: tussen se- 
cundair en primair geheugen gecopieerd), logical records moeten 
dan verder uit een blok geisoleerd vvorden voor gegevensvervverking. 
In deze zin ziin kaarten uit een kaartsysteem te vergeliiken met 
physical records, daar ze met €en bevveging gelicht vvorden. 


De vastlegging van items in een logical record kan nog op verschil- 
lende manieren gebeuren: 
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1. de "fixed" methode (of vaste veldlengte): 
- itemvvaarden (eventueel spaties, indien niet gedefinieerd of 
bekend) vvorden in een vaste volgorde achter elkaar geplaatst, 
- er is een vast aantal items, iedere itemvvaarde heeft ziin eigen, 
constante lengte (eventueel via opvullen met spaties), 
- het begin van iedere itemvvaarde is zodoende een vast aantal 
posities na het begin van een logical record. 
Dit is vvel de meest gebruikte methode door ziln overzichteliikheid 
en eenvoudige hanteerbaarheid. De recordlengte is eveneens 
vast en uiteraard geliik aan de som van de itemlengten. Indien echter 
bii? de verzameling soortgeliike records, de overeenkomstige items 
sterk in lengte varieren, dan geeft deze methode aanleiding tot 
ineffici6nt geheugengebruik. 
Voorbeeld: Indien de gegevens van het hierboven genoemde voorbeeld 
volgens deze methode vastliggen, zouden de records van tvvee perso- 
neelsleden er als volgt uit kunnen zien: 


qansen xxxx İl dam x 18 x amsterdam x 
denderen xx İl val xx 6 x ege xxxxxxx 


nan? max, 1Ü Kar. adres: müx. 17 kar, sasantal 
kinderen: 
max, 2 kar. 


k: stelt een spatie voor, 


2. de "indexed" methode: 

- itemvvaarden vvorden in een vaste volgorde achter elkaar ge- 
plaatst, 

- er is een vast aantal items, maar itemvvaarden hebben een vari- 
abele lengte, 

- daarom is ook de recordlengte variabel en moeten begin- en 
eindposities van iedere itemvvaarde t.o.v. het recordbegin (dus 
per record) apart vvorden biigehouden, 

- voor dit laatste vvorden dan ook hulpvelden (viizers, pointers) 
in het record opgenomen die dienst doen om genoemde begin- 
en eindposities aan te geven. De vviifzers vvorden als regel in 
het begin van een logical record geplaatst. 


Deze methode is geschikt voor problemen vvaarbi/ veel gegevens van 
vvrisselende lengte voorkomen, zoals het geval is bii namen en adres- 
sen. (De rekenautomaat moet "indirect addressing" of "indexing" faci- 
liteiten bezitten voor een effici6nte programmering van deze methode.) 
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Voorbeeld: 
(61:12 İT :28 İ ansen İ dam x 18 x amsterdam İ 3) 
0 , 6 ” 28 


beginpunt "aantal kinderen) 
beginpunt "adres" 
beginpunt "naam" 


a, de "separator" methode: 

- itemvvaarden vvorden in een vaste volgorde achter elkaar ge- 

plaatst, hebben een variabele lengte, 

- zi) vorden van elkaar gescheiden door separators. : 
Deze methode heeft het bezvvaar dat het opzoeken van een bepaald 
gegeven het karakter voor karakter afzoeken van het record vereist, 
hetgeen een tamelifik complex programma vereist indien er geen 
speciale hardvvare instructies ziin. 
Voorbeeld: 


İlansen mi dam x 18 x amsterdamİ:l 3) 


Als separator is hier de , gekozen. 


4. de "label" methode: 

- paren itemnaam-itemvvaarde vvorden, eventueel in een vville- 
keurige volgorde, achter elkaar geplaatst, itemnaam (label) en 
itemvvaarde hebben een variabele veldlengte, 

- deze paren vvorden van elkaar gescheiden door separators. 
Deze methode is een uitbreiding van de vorige in die zin, dat noch 
het aantal itemvvaarden constant hoeft te zi)n, noch de volgorde. 

Het opzoeken van een bepaald gegeven is echter nog eens zo inge- 
vvikkeld, 
Voorbeeld: 


ladres, dam x 18 x amsterdam $ İnaam, iansenİş İaantal kinderen, 3) 


Als separator tussen paren is veer Ş gekozen. 
Als separator binnen paren is , gekozen. 


De tvvee laatste methoden vvorden niet veel gebruikt. Mengvormen 
van deze vier methoden, vooral van de eerste tvvee, komen ook voor, 
Voorbeeld: mengvormen van 1 en 2: 
Stel elk personeelslid heeft ook nog een 3-cifferig iden- 
tificatienummer. Dan zou men volgende recordopbouvv 
kunnen kiezen: 
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8 103 109 Ti5 / fansen Taan 7 18 7 amsterdam, 
7(c7COC(71: 


sleutel beginpunt 
of iden- naam 
tificatie i 


ı “ 
aantal beginpunt 
kinderen adres 


Opmerkingen: : 

1. Variabele veldlengte geeft veelal aanleiding tot een variabele lengte 
van het logische record. Dit hoeft echter niet. 

Evenzo geeft opblokken van logische records met variabele lengte tot 
een fysisch record (blok) veelal aanleiding tot blokken met variabele 
lengte. Ook dit is niet noodzakeliik. 

2. Bi) de eerste drie methoden bepaalt de volgorde de betekenis van 
de vvaarde, de naam van het item vvordt immers niet opgeslagen. Deze 
vaste volgorde zal ook in de programma s die met deze records veer- 
ken (vragen, muteren) een rol spelen. Men kan dit voorkomen door 
bi) de verzameling records als extra informatie de betekenis van de 
volgorde op te nemen. Het enige verschil met methode 4 is dan dat de 
namen van de items slechts eenmaal opgenomen hoeven te vvorden en 
niet per record, omdat de volgorde van items in alle logische records 
dezelfde is. 


2.4 Bestanden 


Een geordende verzameling logical records, die dezelfde structuur 
(aard en vastlegging van items) bezitten, heet een bestand (file). 
De ordening kan het gevolg ziin van de vviize vvaarop het bestand oor- 
spronkeliik opgebouvvd vvordt, maar ook van het sorteren van logical 
records op grond van de daarin voorkomende sleutel(s). Een bestands- 
grootte, dat vvil zeggen het aantal 1ogical records, kan als regel 
slechts bi) benadering opgegeven vvorden. 

De fysieke vastlegging geschiedt meestal op een bepaald type informa- 
tiedrager (volu me), biyvoorbeeld een magneetband (tape-reel) of 
schiifeenheid (diskpack). VVanneer op zo"n informatiedrager meerdere 
bestanden vvorden vastgelegd (uiteraard duideliik van elkaar geschei- 
den), dan spreekt men van een multifile volume, vereist omgekeerd 
een bestand meerdere volumes, dan spreekt men van een multivolume 
file. Aan een informatiedrager vvordt met behulp van een etiket veelal 
een externe bestandsnaam toegekend voor de menseliyke identificatie. 
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Een verzameling bestanden vvordt vel databank (data base) ge- 
noemd, al vvordt deze term ook vvel gereserveerd voor databanken, 
die op €en volume opgeslagen ziln en vvaarin ieder item slechts e6en 
keer voorkomt. 


Een bestandsorganisatie vvordt gekenmerkt door de ordening 
van logical records in een bestand en door de afbeelding van de logical 
records op de fysieke informatiedragers. De keus van een bepaalde 
bestandsorganisatie vvordt bepaald door specifieke probleemeisen ten 
aanzien van toegankeliikheid voor en kosten van het aanbrengen van 
VVİİZigingen en aanvullingen, voor het terugvinden van informatie, door 
beveiligingsaspecten en door de beschikbare apparatuur. 


Bestanden vvorden ondervvorpen aan bevverkingen, die als volgt te 

rubriceren ziln: 

- toevoegen (inserting) van records aan een bestand (het op- 
bouvven van een nieuv bestand moet als biyzonder geval hiervan 
gezien vvorden), 

- veranderen (updating) van (bepaalde delen van) sommige 
records in een bestand, 

- verviideren (deleting) van bepaalde records in een bestand, 

- opzoeken van gegevens in een bestand op grond van hetzi) kennis 
van de sleutel (vve zullen dit eenvoudige proces "searching" 
noemen) of op grond van de vvaarden van e€en of meer items 
((retrieval" te noemen, searching is dan retrieval op grond van het 
sleutelitem), 

- het sorteren van de records van een bestand. 


De eerste drie bevverkingen veranderen iets aan het bestand, de 
vierde bevverking niet. Deze laatste is echter de basisoperatie: men 
moet eerst het record "vinden" alvorens te kunnen veranderen of 
vervvilderen., 

Im samenhang met deze bestandsbevverkingen vvorden de volgende 

begrippen gebruikt: 

- bestandsaktiviteit (file activity). Hiermee vvordt bedoeld het percen- 
tage logical records in een bestand dat tiğdens het gebruik van een 
bestand betrokken is bi) den of meer van deze bevveerkingen 

- bestandsverandering (file volatility) ook vvel veranderingsgraad 
genoemd. Hiermee vvordt bedoeld het percentage logical records in 
een bestand dat tiidens het gebruik betrokken is bi/i updating alleen 

- bestandsverloop (file turnover) of vervangingsgraad. Hiermee vvordt 
bedoeld het percentage logical records dat per periode vvordt ver- 
vrilderd en/ of vervangen 

- bestandsgroei (file grovvth) . Hiermee vvordt bedoeld de procentuele 
verandering in het totaal aantal logical records van een bestand per 
periode (dag, maand enz.). 
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Voorbeeld: als 10976 van alle records uit een bestand vvordt vervvi)derd 
en eenzelfde hoeveelheid nieuvvee records vvordt in dezelfde periode 
toegevoegd dan is de file turnover 107. 

m dat geval is de file grovth nul en de file activity 2076. 

mdien echter 3076 van de records vvorden toegevoegd dan is de file 
turnover eveneens 1096, en de file grovth 2076 en de file activity 4077. 
VVorden tenslotte 2070 van de records vervvi)derd en 1070 toegevoegd 
dan is de file grovvth 1076, de file turnover 109? en de file activity 3077. 


De voor ieder van deze bevverkingen benodigde tiid vvordt bepaald 
door de grootte van het bestand en door de bestandsorganisatie. 

VVat de "beste" bestandsorganisatie is, hangt dan ook af van het soort 
bevverkingen vvaaraan een bestand het meest ondervvorpen vvordt en 
van veiligheidseisen die gesteld kunnen vvorden. 


3 LOGISCHE STRUCTUREN, OPSLAG-STRUCTUREN EN 
ACCESMOGELTIKHEDEN 


3.1 Logiüsche structuren 


De logische structuur hangt samen met de v/iize vvaarop men met de 
gegevens vvil veerken. 

In principe is er maar €en type logische structuur: de netverk- 
structuur (graph, netvorkstructure). Vaak vvorden er echter 

een drietal genoemd: sequenti6le structuur, boomstruc- 
tuur (treestructure) en netverkstructuur. 


1. Sequenti6le structuur: 

Hierin vvordt naar ieder element - behalve het eerste - vervvezen door 
slechts 6en element, tervviil vanuit een element ook slechts naar €€n 
element vervvezen kan vvorden. 


ə — — hi e —)ə: e —— )ğə-e ——)i e ———)əə ——Şpəə 


e : element, -—ə. : vervviizing 


2. Boomstructuur: 

Hierin vvordt naar ieder element - behalve het eerste - vervvezen door 
slechts 6ön element, tervvi)l vanuit een element naar meerdere ele- 
menten vervveezen kan vvorden. 


... 
/.—. 
VN UN 


Opm.: Ga na dat de sequenti€tle structuur een biizonder geval is van 
de boomstructuur. 
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ə, Netverkstructuur: 

Hierin kan naar ieder element vervvezen vvorden door meerdere ele- 
menten, tervvi/ll vanuit een element naar meerdere elementen vervve- 
zen kan vvorden. 


ÖN 
/£ 
27. 


Opm.: Ga na dat de boomstructuur een speciaal geval van de netvverk- 
siructuur is. 


3.2 Opslagstructuren (fysteke structuremn) 


De fysieke structuur of opslagstructuur van een bestand vordt 
in eerste instantie bepaald door de eigenschappen van de informatie- 
drager en daarnaast door de gevvenste logische structuur. 

In d3it verband is het vervvarrend dat dezelfde terminologieen voor 

fysieke structuren gehanteerd vvorden als voor logische structuren. 

Men dient onderstaande structureringsmogeliikheden dan ook op te 

vatten als methoden om logische structuren te implementeren. 

In een ongestructureerd ("serial") bestand is er geen enkele 

relatie tussen de records van een bestand, zi) staan biyvoorbeeld in 

de volgorde vvaarin de records toevallig aan het bestand toegevoegd 
ziin. Als regel ziin bestanden echter gestructureerd, men kan onder- 
scheiden: 

- Sequenti6tle structuren, vvanneer de fysieke volgorde der 
records op grond van "een of ander kenmerk tot stand is gekomen, 
als regel op grond van de vvaarde van de sleutel (oplopend of soms 
afnemend) en soms op grond van de activiteit (bevverkingsfrequentie) 
van de records. Er is geen relatie tussen recordsleutel en het 
(absolute) adres van het record op een informatiedrager. (Deze 
organisatie zal men veelal bi) magneetbanden als informatiedragers 
toegepast zien.) 

- Villekeurig toegankeliike ("direct") structuren, 
vvanneer records zodanig op een informatiedrager geplaatst vvorden 
dat er vvel een verband is tussen recordsleutel en (absoluut) adres 
van het record op een informatiedrager. De informatiedrager dient 
dan uiteraard adresseerbaar te ziin (bifvoorbeeld schiivengeheu- 
gens). 

- Lifststructurehn (sliertstructuur, "list structure"), vvanneer 
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records die logisch bii elkaar horen (biivoorbeeld bii dezelfde sleu- 

tel) met elkaar verbonden ziin met behulp van viizers ("pointers"), 

die iin tegenstelling tot de vorige tvee structuren 
een uitbreiding van ieder record met die vvifzer vereisen. Biizon- 
dere gevallen van lifststructuren ziyn: 

- enkelvoudige kettingstructuren (ketting in 6€n richting), vvanneer 
in ieder (behalve het laatste) record een vviizer opgenomen is 
naar het volgende op de een of andere vviize logiseh samenhan- 
gende record, 

- dubbele kettingstructuren (ketting in tvvee richtingen), vvanneer 
in ieder record (behalve laatste en eerste) een vviizer staat naar 
het volgende en een vviizer naar het vorige record, 

- ringstructuren (circular list), vvanneer het laatste record in een 
kettingstructuur een vviizer naar het eerste bevat en het eerste 
(eventueel) een vviizer naar het laatste record (het "eerste" 
record moet dan door een bi/zonder kenmerk als zodanig her- 
kenbaar zi)n) , 

- boomstructuren, vvanneer naar ieder record, behalve het eerste, 
door slechts 6€n ander record vervvezen vvordt , 

- netvverkstructuren, vvanneer naar ieder record door €en of meer 
andere records vervvezen vvordt. 


3.3 Accessmogelüykheden 


Om de vervvarring te vergroten vvorden voor de accessmethoden (toe- 
gang tot het bestand) vveer dezelfde termen gebruikt als voor de op- 
slagstructuren (sequentieel, direct). 

Daarom moeten vve ook onderscheid maken tussen de structuur 
van een bestand, dat vvil zeggen de opbouvv en plaats van records in 
een bestand, en de to e gan g tot een bestand, dat vil zeggen de 
VVİİZ€ VVaarop vve aan een bepaald record komen. 

Ten aanzien van de to e gang tot een bestand is men tot op zekere 
hoogte afhankeliik van de structuur van het bestand (en zoals vve 
later zullen zien van de aard van de informatiedrager). Bi) onge- 
structureerde bestanden zit er voor het zoeken van een record niet 
veel anders op dan alle records achter elkaar te bekiyken totdat 
men de gezochte records gevonden heeft (dit proces heet "lineair" 
zoeken, linear search of sequenti6ele zoek). Als er meerdere 
records met dit zoekkenmerk ziin, dan moet men het hele bestand 
doorzoeken (full search). 

Bi) sequentieel gestructureerde bestanden kan men lineair zoe- 
ken tot de gevvenste records gevonden ziiln of de plaats vaar ze 
hadden moeten staan gepasseerd is, hetgeen door vergeliiking van 
sleutels te bevverkstelligen is (kan dit bi) ongestructureerde bestan- 
den ook?). In principe ziin ook andere methoden mogeliik (of de in- 
formatiedrager daarvoor geschikt is, zullen vve later bekiyken), 
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bifvoorbeeld "binair" zoeken, vvaarbi) vve ieder interval vvaarin 
de gezochte records kunnen liggen (oorspronkeliğk het hele bestand) 
steeds verder in tvvee stukken (niet noodzakeliik even groot) verdelen 
totdat de gezochte records al dan niet gevonden ziin. Nog een andere 
methode heet skip-sequential zoekelhn (getrapt sequentieel 
zoeken), hierbi?i gaat men - steeds sleutels vergeliikend - eerst met 
grote "sprongen" door het bestand, vvordt een passeren van de moge- 
lifke plaats van de gezochte records geconstateerd dan gaat men met 
vvat kleinere sprongen vanaf het beginpunt van de laatste sprong 
zoeken, enzovoort. 

Bi/i direct gestructureerde bestanden heeft men per definitie toegang 
tot gezochte records zonder andere records te inspecteren. Dit kan 
gebeuren met een "directe" zoek vvanneer het adres van de gezochte 
records direct volgt uit de sleutel of met een "indirecte" zoek, vvan- 
neer uit de sleutel via een of andere algoritme of via een tabel eerst 
nog het adres berekend moet vvorden. VVe komen hier later nog op 
terug. 

Bi? lifst-gestructureerde bestanden zal men bii het zoeken van een 
record voor het volgen van de vviizers vveer "voorgaande" records 
moeten inspecteren (tenzi? de relatie tussen sleutel en recordadres 
bovendien nog via een aparte indexlif/st op te sporen is. Ook hier is 
dan - mits er een volgorde is - binair zoeken etc. mogeliik.) Boom- 
structuren dienen zo te vvorden opgezet dat een zo klein mogeliike 
inspectiereeks nodig is. 


Opmerking: 

Van de vier hoofdbevverkingen op bestanden (opzoeken, vviizigen, 
vveglaten, invoegen (zie hoofdstuk 2)), is het opzoeken in het voor- 
gaande uitgebreid behandeld. Bi) alle opslagstructuren, behalve de 
direct toegankeliike, is het opzoeken de basisbevverking voor de ove- 
rige drie genoemde bevverkingen, bifi de direct toegankeliike is het in 
elk geval de basisbevverking voor "vvifzigen" en "veeglaten". 

Indien men dan ook de mogelifke opslagstructuren vergeliikt met 
betrekking tot deze hoofdbevverkingen, dan betekenen tiydrovende op- 
zoekmogeliyikheden ook tifdrovende overige bevverkingen. 


Daarnaast kan men het volgende opmerken over de overige beveer- 

kingen: 

- VViizigen zonder dat de recordlengte vvi/zigt. 
Dit kan bi/ alle opslagstructuren even snel, bepalend is hier de 
zoektiid voor het record. 

- VViizigen met verandering van recordlengte. 
Bi) opslagstructuren vvaarin de records fysiek naast elkaar liggen 
betekent een kortere lengte het ontstaan van gaten, die op de een 
of andere vviize geadministreerd moeten vvorden (vriie ruimte) of 
door opschuiven van de staart opgevuld moeten vvorden. Een ver- 
groting van de recordlengte vereist zonder meer opschuiven. 
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Bi) de overige opslagstructuren kan dit probleem zich ook voordoen, 
afhankeliik van de vviize van implementeren. In het volgende hoofd- 
stuk vvordt hierop nader ingegaan. 

- VVeglaten. 
Hiervoor gelden dezelfde opmerkingen als bi) het vvifzigen met ver- 
kleining van recordlengte. 

- Invoegen. 
Dit kan eenvoudig geschieden bi) een ongestructureerd bestand. 
Hier is het in feite geen "invoegen", maar "achteraan toevoegen". 
Bi) sequentiele structuren dient zich het opschuifprobleem vveer 
aan. 
Bi) direct toegankeliike structuren is invoegen geen probleem als 
elk record een eigen fysisch adres heeft. 
Bi? lifststructuren komt invoegen in principe neer op het vviizigen 
van vviizers. 


Resumerend kunnen vve stellen dat het opschuifprobleem en het gaten- 
probleem zich altiid voordoen bi) die opslagstructuren vaar de struc- 
tuur vastgelegd is in die fysische ordening van records (ongestruc- 
tureerd en sequentieel gestructureerd), tervvi/l bii de overige struc- 
turen het probleem zich niet of in veel mindere mate voordoet. 

De pri/s die men daarvoor betaalt is een adresberekeningsalgoritme 
of administratie van vviizers. 


Na de bespreking van informatiedragers zullen vve aan de hand van 
enkele in de praktiğik veel gebruikte bestandsor ganisaties zien, dat 
bepaalde combinaties van structuren nuttig ziin. 


4 INFORMATIEDRAGERS 


De meest gebruikte informatiedragers in een computersysteem zifn 
ponskaart, ponsband, magnetische band, schiff en trommel. 
Ponskaart en ponsband vvorden momenteel biina uitsluitend gebruikt 
als invoermedium in tegenstelling met eerste en tvveede gener atie 
computers vaar nog uitgebreide permanente ponskaartenbestanden 
gebruikt vverden. 

Ook als invoermedium is er een tendens om de ponskaart en pons- 
band te vervangen door snellere invoermedia zoals magnetische 
kaarten en magneetband, vvaarbi) een directe registratie plaatsvindt 
via bifvoorbeeld een toetsenbord op deze magnetische geheugenvor- 
men. Voor de opslag van permanente bestanden ziin de meest ge- 
bruikte informatiedragers de magnetische band, - schi/f, - trommel 
en - stripgeheugens. 

Deze secundaire geheugens hebben een gemeenschappelifike eigen- 
schap: informatie vvordt hierop opgeslagen in series van een groot 
aantal karakters. Een dergeliike serie vvordt blok genoemd. Tussen 
de blokken is om technische redenen steeds een vri)le ruimte noodza- 
kelifk. Deze ruimte voordt blokhiaat of gap (blockspace) genoemd. 
Kiest men de bloklengte klein dan bliiğft een relatief groot deel van de 
beschikbare geheugenruimte onbenut in de vorm van de blokhiaten. 
Om deze reden zal men in vele gevallen bii records met niet te grote 
recordlengte er een aantal samenpakken tot een blok. Men spreekt dan 
van geblokt met als blokkingsfactor het aantal records per 
blok. Hier doet zich dan het geval voor van records die tegen elkaar 
geplaatst staan. Ingeval €€n record overeenkomt met €en blok spreekt 
men vvel van ongeblokt. 

Een record is dus een eenheid vanuit gebruikersstandpunt, een blok 
daarentegen een eenheid vanuit technisch computerstandpunt. Deze 
begrippen vvorden nog vvel eens door elkaar gehaald, hetgeen in de 
hand gevverkt vvordt door de Engelse benamingen. Daarbi/ vvordt het 
hier gedefinieerde record aangeduid als logical record, tervifl 
een blok dan genoemd vordt physical record. Via vertaling 
doen in het Nederlands dan vveer de benamingen logisch record en 
fysiseh record hun intrede. Eenvoudiger is echter de korte en duide- 
lifk gesecheiden benamingen record en blok aan te houden zoals hier- 
voor omschreven. 

Op overeenkomstige manier vvordt de bloklengte vveer onderscheiden 
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in vaste bloklengte en variabele bloklengte. Soms geeft men 
hier nog een derde vorm aan als ongedefinieerde bloklengte 
(figuur 1). VVanneer men dit doet brengt men eigenliy)k een splitsing 
in het begrip variabele bloklengte. Onder variabele bloklengte ver- 
staat men dan een blok van variabele lengte echter voor afgegaan door 
een lengte aanduiding. Bi) een ongedefinieerde bloklengte ontbreekt 
deze lengte aanduiding, zodat daar de lengte van een blok alleen be- 
paald vvordt door de scheiding van het volgende blok in de vorm van 
het blokhiaat. 


Ongeblokt vaste lengte records 


Record 3 
100 kar. 


Blokkingsfactor “ 1 
Recordlengte z 100 kar. 


Geblokt vaste lengte met vaste blokkingsfactor 


A 
100 kar, 


Blokkingsfactor 
Recordlengte 


Ongeblokt variabele lengte records 
Record 3 
150 kar, 


Record 1 
100 kar, 


Blokkingsfactor “ 1 
Recordlengte - maximaal 150 kar, 


Geblokt variabele lengte records met vaste blokkingsfactor 


"parası - A 
Recordlengte - maximaal 150 karakters. 


Geblokt variabele lengte records met variabele s Zam 


Zı Bı Record 1 Record 2 Record 3 İ Record 4 
z : 100 rı 120 kar. 150 kar. 50 kar. 
”. RE” OREİ iRL1 ” 


- bloklengte RL “ recordlengte 


əə - variabel 
Recordlengte - maximaal 150 karakters 
Bloklengte - maximaal 450 karakters 


Aangeven bloklengte en recordlengte niet in alle 


"data management" 
verplicht, 


Figuur 1: Blokformaten. 
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Magxneetbanden 

De oudste vorm van secundair geheugen is het magneetbandgeheugen. 
Magneetbanden kunnen eenvoudig gebruikt vvorden voor blokken met 
variabele lengte aangezien directe adressering ontbreekt. De blokken 
ziin met inachtname van de blokhiaten direct achter elkaar geplaatst, 
vvaarbi) de plaats van een blok bepaald vvordt door het overige. Mag- 
neetbanden lenen zich dan ook uitsluitend tot sequenti€le bestandsor- 
ganisatie die met sequentiele vervverkingstechniek gebruikt vvordt. 
Mutaties, vveglatingen en aanvullingen ziin niet aan te brengen, aan- 
gezien men een tussengelegen blok niet opnieuvv kan beschrifven. 
Muteren betekent dus copi€ren onder geliiktiidige aanpassing van het 
nieuvve bestand (ga na dat door copi€eren het opschuifprobleem niet 
voorkomt). 

Magneetbanden vormen een betrekkeliik goedkoop medium en vooral 
voor opslag buiten de computer ziin magneetbanden eenvoudig, com- 
pact en goedkoop. 

Men heeft in het verleden vvel een enkel type magneetbandeenheid ge- 
maakt vvaarbi?i vvel sprake vvas van directe adressen en men ook vvii- 
zigingen kon aanbrengen. Aangezien deze typen betrekkeliik lang- 
zaam vverkten is dit nooit een succes gevvorden, temeer omdat voor 
vvillekeurige toegang de vvachttiiden (enige minuten) toch te lang ziln. 
Indien door de aard van het probleem een sequentieel bestand met 
sequenti€le vervverking geen bezvvaar vormt, ziin magneetbanden 
nog altiid een aantrekkeliik goedkoop medium om mee te vverken. 


Door de technische noodzaak om bi/f mutaties een nieuvv bestand op 
een andere magneetband te cre€eren kriigt men voor zeer veinig 

— kosten en moefte bovendien een veiligheidsmaatregel tegen machine- 
storingen en fouten. Bevvaart men nameliik enige generaties bestan- 
den met tussengelegen mutaties (grootvader, vader, zoon systeem), 
dan heeft men een zeer effectieve methode om ingeval van calami- 
teiten de zaak vveer te herstellen. Bi/i andere media, die op zich 
meer mogeli/ikheden bieden, kunnen de voorzorgen voor herstel na 
eventuele c alamiteiten vaak zeer ingriipend ziin. 

Naast de magneetbanden bestaat een aantal andere vormen van secun- 
dair geheugen, die uit een oogpunt van bestandsor ganisatie min of 
meer identiek ziin behoudens omvang en snelheid. Hiervan ziln te 
noemen trommel, schiiven en magnetische strips. 


Schifivengeheugens 

Teder schiivenpakket bestaat uit een aantal schiiven op 6€€en as, vvaar- 
bii de schiiven in de regel aan beide zifiden in concentrische cirkels 
besehreven kunnen vvorden. Een dergeliike cirkel noemen vee spoor 
of tr ack (zie figuur 2). Het lezen en schriiven van en op een spoor 
gebeurt via een electromagnetische schri/fleeskop. Men kent daarbii) 
tvvee systemen. In het eerste systeem is per schif/fziide slechts 6€en 
sechriifleeskop aanvvezig, die dan bevestigd is aan een verplaatsbare 
arm, zodat de kop voor ieder gebruik in de fuiste positie boven een 
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spoor gebracht kan vvorden. Dit kost echter tiid. Hoevvel er verschil- 
lende typen bestaan en bovendien de tiid ook afhangt over hoeveel 
sporen de arm zich moet verplaatsen, moet men voor een dergeliike 
insteltifd denken in de orde van grootte van 100 msec. Bii het tvveede 
systeem ziin per schiifziide evenveel schriifleeskoppen als sporen 
aanvvezig. In dit geval ontbreekt natuurliik de insteltiğd van de arm. 
VVel hebben vve voor dit systeem evenals bii/ het eerste nog te maken 
met een vvachttiid totdat de fuiste positie van het spoor onder de 
sechriyfleeskop is aangekomen. Dit ligt gemiddeld op een halve om- 
vventelingstiid van de schiif. Dit betekent een grootteorde van 10 msec. 
Men kan deze tiğld niet zo gemakkeliik veel kleiner maken, omdat men 
dan mechanische moeliliikheden kriigt met een te snel draaiende 
schiif. Een gedeelteliike oplossing die men soms kiest is per spoor 
meerdere schrii/fleeskoppen aanbrengen, maar dit verhoogt natuurlii/k 
vveer de kosten. 

Schiiven met vaste koppen ziifn in het algemeen iets duurder. Boven- 
dien ziin schiiven met vaste koppen in vele gevallen niet uitvissel- 
baar. 

Veel standaardprogrammatuur voor bestandsorganisatie is gebaseerd 
op de schi/ven met instelbare arm, met dien verstande dat men tracht 
tifdens het gebruik van bestanden deze armbevvegingen zoveel moge- 
lifk te beperken. Men beschouvt daartoe alle sporen van de verschil- 
lende schiiven die recht onder elkaar liggen en dus achtereenvolgens 
bereikt kunnen vvorden zonder armverplaatsing als een geheel en 
noemt dit een cilinder (zie figuur 2). In tegenstelling tot magneet- 
banden is bii schiiven vvel sprake van adressering. Het adres van een 
blok vvordt allereerst bepaald door het nummer van het schiivenpak- 
ket (indien althans meerdere pakketten ziin aangesloten), vervolgens 
door het cilindernummer en daarna door het spoornummer. Tot zo- 
ver ziin vriyivvel alle systemen geliik behoudens verschillen in aantal- 
len pakketten, cilinders en sporen. Tenslotte bliift over de positie- 
bepaling per spoor. Hier bestaan meer principi6€le verschillen. In 
sommige systemen is ieder spoor bii voorbaat verdeeld in een aantal 
sectoren, vvaarbii per sector een blok opgeborgen kan vvorden. 
Adressering is dan simpel, omdat iedere sector een nummer heeft 

en via hardvvare na opgave van het gevvenste sectornummer direct het 
Tuiste blok gelezen of geschreven kan vvorden. Deze vverkvviize im- 
pliceert overigens min of meer een vaste bloklengte. 

In andere systemen daarentegen vvordt ieder spoor als een aaneenge- 
sloten opbergruimte beschouvvd, vvaarvan alleen het beginpunt elec- 
tronisch is gemarkeerd, en vvelke ruimte men dan nog naar eigen 
inzicht in blokken van bepaalde lengte kan indelen. Dit betekent dat 
men bii/ deze systemen althans per spoor vveer terugvalt op een soort 
sequenti€ele organisatie, omdat de blokken vanaf het beginmerkpunt 
direct achter elkaar geplaatst ziin en de positie van ieder blok vveer 
vvordt bepaald door ziin voorganger. Dit zou betekenen dat het lezen 
van een blok het lezen van het complete spoor inhoudt. Bifl het 
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sehriiven van een blok zou zelfs het spoor eerst ingelezen moeten 
vvorden in het primaire geheugen, dan het betrokken blok ingevuld, 
vvaarna het gehele spoor vveer teruggeschreven moet vvorden. Deze 
complicatie vvordt vermeden door extra faciliteiten in te bouvven in 
de electronische besturing van de schiyven. 

Teder blok laat men voorafgaan door een zeer klein blok bestaande 
uit enige karakters, vvaarin een tellercode of een sleutel kan vvor- 
den opgenomen. Soms ziiln zelfs tvvee blokies mogeliik vvaardoor 
zovvel tellercode als sleutel gebruikt kunnen vvorden (zie figuur 3). 
Men kan dan aan de besturing van het schiivenpakket een opdracht 
geven om te zoeken naar een bepaalde tellercode en/ of sleutel, De 
ti)d die verloopt tiğdens het passeren van het blokhiaat, tussen een 
dergeliik blokie en het daarop volgend blok met informatie, is vol- 
doende voor de besturingselectronica om bii herkennen van de ge- 
vvenste tellercode en,/ of sleutel het lezen of schriiven van het daarop- 
volgende informatieblok in te schakelen. 

In vvezen vvordt dus het sequentieel zoeken per spoor overgelaten aan 
de hardvvare. In sommige uitvoeringen kan dit sequentieel zoeken 
via hardvvare zich zelfs uitstrekken over alle sporen van een cilinder. 
In het algemeen kunnen blokken op een schiivengeheugen herschreven 
vvrorden zonder verstoring van overige informatie, mits natuurliik de 
nieuvve bloklengte overeenkomt met de oude. 


Trommels en magnetische strips 

Trommels en magnetische strips bieden na het voorgaande vveinig 
nieuvve gezichtspunten. 

Indien de trommel is uitgerust met minstens €en kop per spoor kan 
de hele trommel beschouvd vvorden als €öen cilinder. Bi/ enkele 
trommels komen mechanisch verplaatsbare koppen voor, In dat ge- 
val vvorden alle sporen die bereikt kunnen vvorden in een bepaalde 
stand van de koppen als een cilinder beschouvvd en de trommel be- 
staat dan uit evenveel cilinders als het aantal posities dat iedere kop 
kan innemen. VVachttiiden liggen ook hier in de orde van 10 msec. 
Ook bii magnetische strips vvordt het cilinderconcept gehanteerd. 
AHe sporen die in een bepaalde stand van de koppen en via het om- 
leggen van de strip om de trommel bereikt kunnen vvorden vormen 
dan vveer een cilinder. Indien van strip gevvisseld moet vvorden dient 
men rekening te houden met vvachttiiden in de orde van 500 msec. 
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Beveging lees- 
schriif-inrichting 


een schiifziide met magnetische- 
sporen (tracks) in de vorm von 
concentrische cirkels 


CILINDER 


“d..——— 


Figuur 2: Een schiiveneenheid bestaande uit verscheidene 
Troterende schifiven vvaarbi) met behulp van ver- 
scheidene geliik bevvegende 1lees/ schriifkoppen 
steeds een"cilinder" met informatie beschikbaar 
is. 
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İndex polnt z 
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” 
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A.Format vvithout key 


Ef (80)... 


/7 - (1481-—77 tə” block n (Bn) 


- polnt 
EZ informetlon 
“. address / 


.. ez “öd maz 
/ ——. ə ə 
/ ... .. — 


check octads 
data length 
length 
block number 
head number 
eylinder number 
flag 
address marker 
IBG s inter Block Gap 


B. Format vvith key 


Figuur 3: Voorbeeld van een indeling van een spoor bi) 
een schi)vengeheugen zonder sectorindeling. 


Bi? figuur 8: 

- Blok B1 kan de z.g. key sectie bevatten. Zi) is bi) sommige organi- 
satiemethoden nodig om de data sectie te defini6ren. 

- Het index point is een markering van de onderste plaat van de disk 
om het begin van de track te kunnen identificeren. 
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- De gaps, tussen de verschillende blokken, stellen het systeem in 
staat om de positie van een blok in €en om veenteling van de disk te 
identificeren. 

- Elke track heeft een z.g. home address sectie norm ideal vvaarvan 
een track geidentificeerd kan vvorden, 

In het home address ziin cilindernummer (CC) en schri)f-/leeskop 
nummer (HH) opgenomen. 

- Het doel van blok B0 is om zorg te dragen voor een aantal admini- 
stratieve funkties die nodig ziin bii) het schriiven en lezen van een 
spoor. 

- De track identificatie in de Count sectie is niet gerelateerd (zoals bi) 
het home address) aan het begin van het volume maar aan het begin 
van de file. De track identificatie is uitgebreid met het bloknummer. 

- De lengte van de data sectie van de verschillende blokken vvordt ge- 
specificeerd in de voorafgaande count sectie. 

- De blokken B1 tot en met Bn versehillen van het B0 blok doordat zil 
een Address Marker bevatten en al of geen key sectie mogen bevatten. 
De address marker vordt door de Control Unit gebruikt ten behoeve 
van de hardvare. 

- De lengte van de key sectie vvrordt gespecificeerd in de voorafgaande 
count sectie. Als de key sectie niet is opgenomen dan is zifn lengte 0. 


5 VEEL GEBRUIKTE OPSLAGSTRUCTUREN EN BITBEHORENDE 
VERVVERKINGSTECHNIEKEN 


5.1 SequentTöle bestandsorganmüsatte 


Bi) sequentiele bestandsorganisatie ziin alle records fysiek achter 
elkaar geplaatst zonder adressering, zodat de positie van ieder 
record bepaald vvordt door ziin voorganger (effici6nt geheugengebruik). 
Hoevvel niet strikt noodzakeliik bedoelt men met deze organisatie 
meestal ook dat de records aan de hand van een sleutel in een be- 
paalde volgorde ziin gerangschikt. 

Tengevolge van deze eigenschappen leent een sequentiöle bestands- 
organisatie zich praktisch alleen voor sequenti6le verver- 
kingstechniek (sequentieel access) hetgeen veeer batchver- 
veerking (groepsgeviize vervverking) tot gevolg heeft. Immers 
voor een bevverking op €€n record moet men gemiddeld het halve be- 
stand doorlopen. Daarom zal men veelal bevverkingen voor een aan- 
tal records verzamelen (mutatiebestand), deze op sleutelvolgorde 
sorteren en dan tegeliik vervverken. Door de directe aansluiting van 
records betekenen veeglatingen en aanvullingen tevens een copiering 
van het bestand. 


Magneetbanden 

Voor magneetbanden is deze organisatie praktisch de enige bruikba- 
re. Aangezien daarbi) vvegens technische redenen een tussengelegen 
blok bovendien niet gevviizigd kan vvorden, impliceert dit voor iedere 
vorm van mutatie een copiEering van het bestand. 

Bii sequenti6le organisatie met sequentiele vervveerking speelt sor - 
teren veelal een belangriike rol. ledere keer dat men volgens een 
andere sleutel sequentieel vvil vervverken moet het bestand eerst 
overeenkomstig die sleutel geordend vvorden. 


Voorbeeld: 

Stel vve vvillen giro-oversehri)vingen sequentieel vervverken. Men 
heeft dan een sequentieel bestand met records vvaarvan het rekening- 
nummer de sleutel is. Men verzamelt gedurende zekere tiğd (een dag) 
alle mutaties en plaatst die op een band. Deze mutaties vormen dan 
ook een (ti)deliik) sequentieel bestand, zi) het nog ongeordend. Dan 
volgt de eerste sorteer gang voor dit tiğdelifke bestand, vvaarbi) de 
mutaties vvorden geordend volgens rekeningnummers van afschrii/ving. 
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Sequentieel kan dan deze mutatieband tezamen met het hoofdbestand 
vervverkt vvorden tot een nieuvv voorlopig bestand, vvaarin alle af- 
schriyvingen ziin vervverkt. Dan volgt de tvveede sorteergang voor de 
mutaties, vvaarbi) de volgorde vvordt overeenkomstig rekeningnum- 
mers van biğschriyving. Dit mutatiebestand met het voorlopig nieuvve 
hoofdbestand vvorden dan sequentieel vervveerkt tot het nieuvve hoofd- 
bestand. Het is natuurliik een gesimplificeerde voorstelling, vvant 
allerlei noodzakeliyke nevenvveerkzaamheden ziin hier buiten beschou- 
vring gelaten zoals opbouvr van het noodzakeliike uitvoerbestand, be- 
standen voor centrale registratie, controle, statistiek, enzovoorts. 
VVel is uit dit voorbeeld duideliğk dat sequenti6le organisatie vveinig 
moeiliykheden geeft bi$ beveiliging tegen calamiteiten. 
İmmers in het voorgaande voorbeeld vernietigen vve niet het oude 
hoofdbestand nadat het nieuvve is gevormd, maar bevvaren dit bene- 
vens het mutatiebestand. Het oude hoofdbestand noemen vve dan de 
vader en het nieuvve bestand de zoon. Bi) vervverking van de volgende 
serie mutaties vvordt de vader dan de grootvader, de zoon de vader 
en het dan nieuvve hoofdbestand de zoon. 

Men heeft daarna drie generaties hoofdbestanden met tussengelegen 
mutaties. De daarop volgende keer kan men dan de oudste generatie 
vernietigen hetgeen eenvoudig gebeurt door de betrokken magneet- 
banden opnieuvv te gebruiken. De beveiliging bestaat dus simpel uit 
het veilig bevvaren van een aantal generaties hoofdbestanden met de 
daarbi) behorende mutatiebestanden. 


Schifvengeheugens 

Bi) de sequentiöle bestandsorganisatie op schiiven vvorden de infor- 
matie-eenheden direct achter elkaar vastgelegd en vvel zodanig dat 
hogere identificaties (keys) ook hogere schiivenadressen hebben. 
Hierbi) is geen enkele directe relatie tussen een recordidentificatie 
en het biğ)behorend schiyvenadres. Een schematische voorstelling 
van een dergeliğk bestand is opgenomen in figuur 4. De nummers 

1, 3, 5, 6, 7, 9 enzovoorts geven de records ver met de desbetref- 
fende identificaties. Op elke schiifziyde vvorden in dit voorbeeld per 
informatiespoor steeds vier records vastgelegd. De ponskaartaf- 
beeldingen met de nummers 3, 9 en 14 geven de mutaties ver die 
betrekking hebben op de records met de biibehorende identificaties. 
Voor het vervverken van deze mutaties moet elke informatie-eenheid 
gelezen vvorden en in de computer vvorden vergeleken met de in de 
mutatiekaart opgenomen identificatie. VVanneer een geliikheid vordt 
geconstateerd kan het desbetreffende record gemuteerd vvorden met 
de in de kaart opgenomen informatie. Om deze procedure zo effici- 
önt mogelifk te laten verlopen vvorden de mutaties vooraf gesorteerd 
in dezelfde volgorde als die vvaarin het bestand is vastgelegd. Per 
bevverking moet bi) deze methoden vvel een redelifike verhouding be- 
staan tussen het aantal mutaties en het aantal records in het bestand 
(batchvervveerking). 
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CILINDER 


Mutaties: 


S 
Cc 
H 
R 
I 
q 
F 
I 
N 
R 
I 
C 
H 
T 
I 
N 
G 


Figuur 4: Schematische voorstelling van sequenti6le bestands- 
organisatie. 


Deze vverkviize maakt geen gebruik van de specifieke mogeliikheden 
die direct toegankeliike externe geheugens bieden en vvordt dan ook 
het minst van alle methoden toegepast. Daarbii komt dat de eenmaal 
vastgelegde logiseche volgorde gehandhaafd dient te bliyiven. Daar ve 
İiever niet copiören (hoeft niet bi) schi)ven) ontstaat het probleem 
dat er binnen het bestand geen ruimte beschikbaar is voor het tus- 
senvoegen van nieuvve records. Dit vvordt meestal opgelost door de 
nieuvve records tiğdeliyk in een ander gebied in de schiiveneenheid 

op te nemen. In een later stadium vvorden deze records dan vveer 
samengevoegd met het oorspronkeliike bestand. Teneinde te allen 
tiide een normale vervverking van het gehele bestand mogeliik te ma- 
ken, vvordt met behulp van vervvifsadressen (vi)zers) de logische 
volgorde gehandhaafd. VVanneer biğvoorbeeld in het bestand vveer ge- 
geven in figuur 4 een nieuvv record met identificatie 8 moet voorden 
vastgelegd, kan dit record biğvoorbeeld in cilinder 4 vvorden geplaatst, 
tervi)l in record 7 een vervviizing naar record 8 vvordt opgenomen. 
Record 8 kriğgt dan op ziin beurt veeer een vervvi)zing naar record 9 
in cilinder 1. Op deze vviize bli/ft voor de vervverking de numerieke 
volgorde binnen het gehele bestand gehandhaafd. 
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50.2 1ndex-sequentt61e bestandsorganTsatte 


Een vaak gebruikte tussenvorm van een sequenti6le en een vvillekeu- 

rig toegankeliike opslagstructuur met een tabelrelatie tussen record- 

sleutel en recordadres is de zogenaamde index-sequenti6le : 

organisatie (geindiceerd sequentiele organisatie). Bi) veel toepas- 

singen heeft men namelifk behoefte aan een opslagstructuur vvaarbi): 

- records vvillekeurig toegankeliik ziin (zodat magneetbanden niet 
bruikbaar zi)n), 

- bestanden zo groot ziin dat ook trommels niet voldoen, 

- er soms behoefte aan is om alle records in sleutelvolgorde te ver- 
vverken, tervviill er eigenschappen van het bestand zodanig ziiln dat 
vvillekeurig toegankeliike opslagstructuren niet in aanmerking ko- 
men (door omvang en sleutelverdeling). 

Aangezien zodoende alleen magneetschiiven in aanmerking komen 

heeft men een organisatie ontvvikkeld die aangepast is aan de eigen- 

schappen van een schiif. Met name aan het feit dat bi) een bepaalde 
stand van de schiifarm vele sporen op de schifiven snel uitgelezen 
kunnen vvorden (ze "vormen een cilinder") maar dat een verandering 
van de stand van de schiifarm relatief lang duurt (minimalisatie 

ar mbevveging) . 


De index-sequentiele organisatie komt dan hierop neer dat vanaf een 
vaste plaats (veelal cilinder 0), een zogenaamde cilindertabel (ci- 
linderindex) in het kernengeheugen vvordt gebracht en dat hieruit af- 
gelezen kan vvorden vvat voor iedere cilinder de hoogst voorkomende 
sleutel is. De cilindertabel is op sleutelvolgorde gesorteerd zodat 
met een binaire zoekmethode snel gevonden kan vvorden in vvelke ci- 
linder een record met een bepaalde sleutel zich kan bevinden (hoe- 
vvel niet strikt noodzakeliik zal men mutaties op zo"n bestand liefst 
gesorteerd vervverken, omdat dan het aantal armbevvegingen mini- 
maal isl). 


Van een vast spoor op iedere cilinder (veelal spoor 0 van een cilin- 
der) vvordt dan de zogenaamde sporentabel (tracktable, spoorindex, 
trackindex) in het kerngeheugen gelezen. Hierin staat vveer in sleu- 
telvolgorde vermeld vvat voor ieder spoor de hoogst voorkomende 
sleutel is. Na met een zoekmethode zo voor een bepaalde record- 
sleutel vastgesteld te hebben in vvelk spoor zich het betreffende 
record kan bevinden, kan dit spoor naar het kernengeheugen gebracht 
vvorden (vve nemen hierbii dus stilzvviigend aan dat er in het kernen- 
geheugen voldoende ruimte is om een compleet spoor in te lezen, is 
dit niet het geval dan moeten in de sporentabel ook de nummers van 
de spoordelen vvorden opgenomen). Met een sequentiöle zoek kan dan 
in het spoor het goede record gevonden vvorden. 

Bi) een multivolume file vvordt ook vaak nog een volume-index opge- 
bouvvd, die de hoogste sleutel van elk volume aangeeft. Aldus krifgt 
men indices van drie niveaus: volume-index, cilinder-index, spoor- 
index. 
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Samenhangend met het feit dat in een gegeven bestand records toege- 
voegd of vervvi)derd vvorden, bestaan voor de implementatie van deze 
bestandsvorm verschillende varianten: 

- De simpelste vorm, alleen te gebruiken als er vveinig records aan 


het bestand vvorden toegevoegd, is met de gesorteerde records be- 
stand en tabellen op te bouvven op de beschikbare sporen. 

Een variant is dat men bii de eerste opbouvv van het bestand de 
sporen van een cilinder opeenvolgend met records vult behalve 6en 
of meer overloop-sporen (overflov/) van die cilinder. Moet 
later bi) een mutatie een record tussengevoegd vvorden, dan ge- 
beurt dit na op de goede plaatsen de aanvvezige records een plaats 
opgeschoven te hebben. Het record dat zodoende van het "primaire 
spoor afvalt", vvordt dan op de eerstvolgende vriye plaats van een 
overloopspoor geplaatst. Een nadeel van deze methode is dat via 
het kernengeheugen geschoven en in het overloopgebied nog eens 
sequentieel gezocht moet vvorden, en dat de sporentabel moet vor- 
den biigevverkt. 

Een tvveede variant beoogt het inlezen van een overloopspoor zolang 
mogeliik uit te stellen door in eerste instantie de primaire sporen 
niet voor 10096 te vullen. Pas vvanneer de vriğ)e ruimte op een spoor 
opgebruikt is, moeten overloopsporen ingelezen vvorden. Aangezien 
het "opgebruiken" van vri)e ruimte als regel niet geliikmatig is voor 


alle sporen, is deze variant niet zo gunstig ten aanzien van het ge- 
heugengebruik. Als bi) de eerste variant moet mogeliik de sporen- 
tabel biixevverkt vvorden. 

In een derde variant vvorden de sporen vveer voor 10077 gevuld, 
maar bovendien bevat ieder record in een primair spoor zo nodig 
een vvi)zer naar het begin van een gesorteerde ketting in een over- 
loopspoor. Hiermee is het opschuiven van records in een primair 
spoor overbodig en is de sequentiö6le zoek in een overloopspoor 
effici6nter dan bi) de eerste variant. Het biivverken van de sporen- 
tabel is niet nodig. 


Het vervvi)deren van records gebeurt als regel niet door een fysieke 
vervvi)dering, maar door het aanvvezige record van een kenmerk 
(flag) te voorzien. Bi) alle drie varianten zal het nodig ziin om het 
bestand periodiek te reorganiseren, nameliyk vanneer er 
door een hoge file turnover te veel records in overloopsporen 
zitten. Reorganiseren gebeurt eenvoudig door sequentieel over- 
sehriiven op een nieuvve schiff met geliyktiidig leegmaken van de 
overloopsporen en vervallen records. Uiteraard vvorden hierbi) 
nieuvve cilinder- en sporentabellen opgebouvd. 


Samenvattend kan men stellen: 

- De index-sequenti6ele organisatie neemt meer ruimte in beslag dan 
de sequentiele: 
De cilinder- en track-index moeten opgeslagen vvorden, dit is vaak 
5 tot 1070 van het geheel. 
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Voorts is het primaire gebied groter dan het bestand vraagt 
teneinde nieuvve records in de gaten te kunnen plaatsen (zie vari- 
anten). Daarnaast dient men overflovruimte te reserveren 
voor het geval de gaten vol lopen. 

- Naarmate men start met een hogere bezettingsgraad (vveinig gaten) 
van het primaire gebied zal men met meer overflovv (overloop) 
moeten rekenen. 

- Naarmate meer indices (bifvoorbeeld volume-index en cilinder- 
index) in het kerngeheugen passen, neemt het aantal armbevveegingen 
om een record te bereiken af (maximaal 3, minimaal 1). 


Voorbeeld: 

De algemene opbouvv van een indexed sequential bestand is vveergege- 
ven in figuur 5. De cilindertabel is hier opgenomen in een deel van 
cilinder 01 en bevat de hoogste identificatie en het laagste adres van 
elke cilinder. VVanneer nu een mutatie binnenkomt met biivoorbeeld 
identific atie 279, vvordt het lees/ schriifmechanisme eerst verplaatst 
naar de cilinder 04. Tmmers 279 is hoger dan de hoogste identificatie 
van cilinder 03, maar lager dan die van cilinder 04. Aangezien in de 
cilindertabel bii de hoogste identificatie van cilinder 04 (612) ook het 
laagste adres binnen diezelfde cilinder is opgenomen, kan nu een 
opdracht aan het lees/ sehriifmechanisme vvorden gegeven om van 
cilinder 01 naar cilinder 04 te gaan. 

In figuur 6 is de inhoud van cilinder 04 en de biibehorende indeling 
van de track-index vveergegeven. Op elke track binnen cilinder 04 
ziin steeds drie records opgenomen. Voor het lokaliseren van de 
track vvaarop het record met identificatie 279 voorkomt, vvordt nu de 
track-index geraadpleegd. Hieruit blifkt dat het betrokken record 
zich bevindt op adres 043. Immers 279 is hoger dan 117 en 198, 
maar lager dan 309. Nu kan de fuiste schiifziide binnen de cilinder 
geactiveerd vvorden. Het gevvenste record binnen die track vvordt 
bereikt als tifdens een aantal vergeliikingen van mutatie- en record- 
identificaties een geliikheid vvordt gesignaleerd. 

De procedure die gevolgd vvordt bii het opnemen van nieuvve records 
in een reeds eerder vastgelegd bestand is vveergegeven in de figuren 
6 en 7. Volledigheidshalve geven vi) eerst een toelichting op figuur 
6, speciaal met betrekking tot de track-index. Deze index bestaat 
uit fvvee delen, een "normal-entry" vvaarin vvordt biigehouden hoe de 
vverkeliflke situatie is binnen een track, en een "overflov-entry", 
vvaarin vvordt biigehouden hoe de logische track-samenstelling is 
nadat een aantal nieuvve records is toegevoegd. Voordat het eerste 
nieuvv op te nemen record moet vvorden vervverkt, hebben de normal- 
entry en de overflovv-entry dezelfde inhoud bestaande uit de hoogsste 
identificatie (key) van die track en het startadres (T-A). Stel nu dat 
tvvee nieuvve records moeten vvorden opgenomen, die de identificaties 
142 en 450 hebben. Aangezien altiid binnen een track de logische 
volgorde vvordt gehandhaafd, vvordt record 198 van track 042 "afge- 
schreven" en geplaatst in de gereserveerde ruimte (overflovv- gebied) 
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op track 048. Tets dergeliiks gebeurt ook met record 516 voor het 
opnemen van het nieuvve record 450. 

Daar de inhoud van de normale tracks nu gevviizigd is, vvordt ook de 
normal-entry van de track-index aangepast. Zo vvorden de identifi- 
caties 198 en 516 respectieveliik vervangen door 192 en 450. De 
track-adressen bliiven ongevviizigd. 

In de overflovv-entry bliiven de identificaties ongevviizigd, vvel vvor- 
den de adressen aangepast. Dit is logisch daar de records 198 en 
516 ziin verplaatst naar track 048. De aanduidingen 048-1 en 048-2 
geven aan dat de biibehorende records respectieveliik de eerste en 
de tvveede ziin binnen track 048. Het voordeel van deze aanpak is 
dat nieuvve records vvorden opgenomen in de cilinder, vvaarin ze vol- 
gens de logische opbouvv van het bestand ook thuis horen. 


INDEXED SEQUENTTAL BESTANDSORGANISATTE 


CILINDER 
01 02 03 04 05 06 07 enz. 
BESTAND m 


schiifzi)de 


z hoogste identificatie 
in cilinder 


Cilinder- 


. “ 9) (03), “62 (04), ” 873 (05), ” 999 (06): 
index 


() laagste adres in 
cilinder 


Figuur 5: Schematische voorstelling van een indexed-sequential 
bestand. 
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BESTAND TRACK-TNDEX 


Track-Index Verder 


Veergegeven Normal-Entry Overflov-Entry 


Key T-A Key T-A 

98 102 117 117 041 117 041 

132 192 198 198 042 198. 042 

217 279 309 309 043 309 043 

396 418. 516. 516 044 516 044 
hoogste start 


identifi- adres 
04 8 İ İ catie per van de 

track track 
04 9 İ İ 


Figuur 6: Situatie direct na het vastleggen van het bestand. 
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BESTAND TRACK-INDEX 


əə Verde 
rack-index 
veergegeven 


Normal-Entry Overf lov-Entry 


98 102 1 117 İ 117 İ 041 I 117 041 


132 142” İ 192 192 İ 042 198 İ 048-1 


198. 


217 279 309 İ 309 I 043 ı 309 043 


396 İ 418 İ 450 450” İ 044 516 İ048-2 
516 


verviis VE€TV118 
k adres re 


0418 198İ:042İ 516044 
1 2 


0419 İ İ 


Figuur 7: Situatie direct na het toevoegen van records met de identificaties 
142 en 450 (vvi)zigingen t.o.v. figuur 6 zin aangegeven met ”). 
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0.9 Diürecte bestandsorgam(üsatfe 


Bii de directe of vvillekeurig toegankeliike bestandsorganisatievorm 
İS er, in tegenstelling tot de in het voorgaande beschreven methoden, 
vvel een relatie tussen de identificaties en de adressen van de vast- 
gelegde gegevens. Hierdoor is een snellere toegang tot ieder 

record mogeliyk. In het algemeen vvorden de vastgelegde gegevens 

bii deze methode niet eerst in een bepaalde volgorde vastgelegd. 

Het voordeel hiervan is dat een sorteerbevverking ten behoeve van 

het vervverken van het bestand naar een vooraf vastgesteld gezichts- 

punt komt te vervallen. De methoden van adresbepaling van de 
records kunnen onderverdeeld vvorden in tvvee groepen: de directe 
adressering ende indirecte adressering. 

Bi) directe adressering is er voor elke mogeliyke sleutel- 

vvaarde een adres gereserveerd en dus voor elk mogeliik record op- 

slagruimte. Dit impliceert dat het aantal mogeliike sleutels niet 
groter mag zii)n dan het aantal beschikbare adressen. 

Bi) indirecte adressering kan het aantal mogeliike sleutels 

vvel groter ziin dan het aantal beschikbare adressen. De adresbere- 

keningsalgoritme zal dan ook aan meerdere sleutels hetzelfde adres 
kunnen toevvi?zen. Deze sleutels noemt men synoniemen. 

Naast dit essenti6€le verschil tussen deze beide vormen van adres- 

bepaling uit een sleutel, ziin er nog praktische verschillen: 

- Directe adressering beoogt zo snel mogeliifk het adres te bepalen. 
Dit betekent dat de recordsleutels bii voorkeur numeriek moeten 
zi)n en enigszins op de geheugenadressen moeten liiken. Bi? in- 
directe adressering bestaat deze beperking niet en kunnen de sleu- 
tels volledig door de gebruiker bepaald vvorden. 

- Indien de feitelifk voorkomende sleutels slechts een deel ziin van 
de verzameling mogeliy)ke sleutelvvaarden dan ontstaan bi/ directe 
adressering veelal grote gaten (ineffici6ğnt geheugengebruik): bil) 
indirecte adressering hoeft dit niet op te treden. 


0.3Ə.1 Directe adressering 


Bi) directe adressering bevat de informatie die in het bestand ver- 
vverkt moet vvorden het adres van het biibehorende record. 

Binnen deze methode is vveer een aantal verschillende mogeliikheden 
aanvvezig: 


Sohilfadres € sleutel 

Allereerst is het mogeliğk de identificaties zelf als sehiivenadres 
te gebruiken. Dit kan echter niet altiid, daar de toegepaste identifi- 
caties meestal ziin opgebouvvd volgens een codeersysteem dat geen 
aansluiting geeft op de numerieke adressen van de schiivengeheugens. 
Is dit vvel het geval, dan moet gelet vvorden op de compactheid. 
VV anneer biivoorbeeld de identificaties liggen binnen de vvaarden 
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00000 en 99999 en er slechts 10000 nummers uit deze groep vvorden 
gebruikt dan leidt het hanteren van deze vorm van adressering tot 
een zeer ineffici€nt gebruik van de capaciteit van het schiyvengeheu- 
gen. 

Het probleem kan vvorden opgelost, door de gebruikte codering zo- 
danig om te zetten, dat de nieuvve codering vvel overeenkomst ver- 
toont met de schiivenadressen. In veel gevallen zal dit echter op 
grote praktische bezvvaren stuiten. 


Sechiifadres “€ sleutel via tabel 

VVanneer recordidentificaties en sehiivenadressen niet identiek ziin 
of gemaakt kunnen vvorden, is er nog een tvveede mogeliğykheid om 
tot directe adressering te komen. Dit geschiedt door naast de iden- 
tificaties in de informatie van bestandsmutaties het diskadres als 
extra gegeven op te nemen. Een eis bi) deze mogeliykheid is vvel dat 
vooraf voor elke identificatie een diskadres vvordt vastgesteld en dat 
dit adres steeds via een voorbevverking als extra gegeven vvordt op- 
genomen in de bestandsmutaties. 

De computer kriigt - vvanneer aan deze eis is voldaan - naast de 
nieuvve informatie ook het adres van het biibehorende record inge- 
voerd voor het-biivverken van-het bestand. In het biizonder voor het 
biifveerken van statische bestanden is deze methode aantrekkeliik. 
Een betere oplossing, vvaarbi) nog meer geautomatiseerd is, vvordt 
verkregen door de eenmaal vastgestelde relatie tussen de identifi- 
caties en de schiivenadressen in de vorm van een tabel op te nemen. 
Hierdoor vvordt echter vvel de effectieve capaciteit van het externe 
geheugen aangetast. Bovendien zi)n tiyfdens de vervverking van deze 
bestanden steeds tvvee bevvegingen van het lees/ sechriifmechanisme 
nodig. Te vveten: €€n om de tabel te raadplegen en daarna €6€n om 
het iuiste record te bereiken. Dit is minder aantrekkeliik omdat de 
zeer snelle toegang tot elk afzonderliik record fuist 6€n van de be- 
langriikste voordelen is bi) het gebruiken van random bestandsorga- 
nisatie. 

Een verbetering van de snelheid kan vvorden bereikt door zovvel voor 
het bestand als voor de adrestabel een afzonderliyike lees/ schriifin- 
richting te gebruiken. Bi) een zeer geintegreerde vervverkingsproce- 
dure van een groot aantal bestanden is deze vverkvviize slechts bi) 
uitzondering mogeliik. De gevvenste snelheidsverbetering kan ook 
nog bereikt vvorden door gedurende de gehele computerbevverking de 
directe adresseertabel in het vverkgeheugen van de computer op te 
nemen. Hiervoor dient men vvel over voldoende interne geheugen- 
capaciteit te beschikken. Het is duideliik dat deze methode afhanke- 
lifk is van de computerconfiguratie, de omvang van de bestanden en 
de biibehorende vervverkingsprocedures. 


Sechilffadres via relatieve adressering 
Een, de laatste tiid steeds meer gebruikte vorm van directe adres- 
sering, is de relatieve adressering. 
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Dit verklaren vve aan de hand van een eenvoudig voorbeeld. 
Neem aan dat vve een bestand hebben verdeeld over 5 schiifpakketten 
(volumes), ieder volume omvat 200 cilinders, per cilinder ziin 18 
sporen in gebruik en de recordlengte is van dien aard dat per spoor 
13 records opgeborgen kunnen vvorden. Het gehele bestand omvat 
dan 5 x 200 x 18 x 13 — 234000 records. Om een bepaald adres aan 
te geven is echter een getal van 8 ci/fers nodig, biyvoorbeeld 
Ə1751411, hetgeen betekent volume 3, cilinder 175, spoor 14 en 
sector of positie 11, VVe kunnen de records echter ook doorlopend 
nummeren, in dat geval van 0 tot en met 233999, Dit noemt men dan 
een relatief adres. Tussen relatief en absoluut adres bestaat echter 
een eenduidig verband. 
Aangenomen dat ook volume-, cilinder-, spoor- en sectoradresse- 
ring op 0 beginnen rekent men het gegeven voorbeeld van 31751411 
als volgt om naar een relatief adres ((3 x 200 4 175) x 18 4 14) x 13 
o 11 — 181543. 
Precies in omgekeerde volgorde rekent men bi/i omzetting van rela- 
tief adres naar absoluut adres. Biivoorbeeld het relatief adres 
112028. VVe delen eerst door 13, daarna het quotiönt door 18 en ver- 
volgens het quotient door 200. 
Zo is 112028 - 8617x 13 4 7 

8617 — 478x 18-13 

478 — 2 x 200 4 78. 

Het absolute adres is dus 20781307 nameliik volume 2, cilinder 78, 
spoor 13 en sector 7. 
Gezien de rekensnelheid van moderne computers vormen dergeliike 
omrekeningen geen enkel probleem. 
De omzetting van sleutel naar adres kunnen vve in tvvee stappen den- 
ken nameliğk eerst van sleutel naar relatief adres en daarna de om- 
zetting tot absoluut of fysiseh adres. In het volgende houden vve ons 
alleen bezig met de eerste omzetting. De eenvoudigste transforma- 
tie is 6en op €ön, dat vil zeggen sleutel — relatief adres of sleutel 
- relatief adres “ vast bedrag. Dit laatste kan voorkomen om nullen 
aan de voorziğde van een sleutel te vermiiden. Biivoorbeeld men 
heeft een bestand van 8000 records met relatieve adressen 0 tot en 
met 7999 en nummert dan de sleutels van 1000 tot en met 8999, Dit 
systeem geeft enerziids het grote voordeel dat geen synoniemen 
optreden en de beschikbare geheugenruimte optimaal kan vvorden 
benut. Anderziyds bestaat het grote nadeel dat de sleutels vvorden 
bepaald door het computersysteem en dus niet gekozen kunnen vvor- 
den vanuit gebruikersstandpunt. Voor vele toepassingen is dit een 
ontoelaatbare beperking. Heeft men als voorbeeld een bestand vvaar- 
bi? de records bestaan uit persoonsgegevens tervvi/l de sleutel ge- 
vormd vvordt door de naam, dan kan men niet de naam van de men- 
sen vviizigen en hen als "naam" een relatief adresnummer geven. 
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Schiffadres via relatief adres, relatief adres via 
tabel 

Een oplossing die toch van deze methode gebruik maakt bestaat hier- 
uit dat men buiten de computer een soort naamlifst aanlegt vvaarin 
achter ieders naam het biibehorende relatieve adres voorkomt. 
Iedere keer dat men aan de computer mutatiegegevens toevoert, 
moet men tevens de opgezochte "sleutel" uit de naamliist meegeven. 
Het expliciet opzoeken is soms te vermii)den, vvanneer men vverkt 
met voorbedrukte of voorgeponste formulieren biy)voorbeeld een 
girokaart, vvaarop niet alleen de naam, maar ook het gironummer 
voorkomt. 

Op een bankcheque kan men behalve de naam en het gebruikeli/ke 
banknummer ook reeds een dergeliik relatief adres vermelden. Nog 
een stap verder is de "naamliifst" zelf in het computergeheugen opge- 
nomen. Gezien de omvang van een dergeliike liist kan die veelal 

niet in het primaire geheugen staan, dat vvil zeggen deze naamliifst 
vvordt een bestand op zichzelf vvaarvoor men bilvoorbeeld sequentieel 
of index-sequentieel kan kiezen. De records van een dergeliik be- 
stand ziin natuurliik erg eenvoudig vvant ze bestaan in principe uit 
slechts tvvee velden, nameliik de sleutel en het relatief adres van 
het record in het directe bestand. De toegang tot een record betekent 
dan toch reeds minimaal tvvee verschillende achtereenvolgende toe- 
gangen tot het achtergrondgeheugen. De omzetting van relatief adres 
naar een absoluut adres vvordt door de meeste standaardprogramma- 
tuur automatisch uitgevoerd, hierbii/ lettend op de plaats vvaar het 
relatief bestand zich bevindt op de schiif, de lengte van de fysische 
records, etc. 

Met de laatste behandelde vorm van relatieve adressering is het 
eigenliik dubieus of men nog vvel mag spreken van relatieve adres- 
sering vvant het principe vvas dat de sleutel geliik is aan het relatief 
adres. 


5.3.2 Indirecte adressering 


VVerden in het voorgaande de sleutelvvaarden toch beinvloed door de 
mogeliikheden van de adresvvaarden, bi/ indirecte adressering is 
deze koppeling niet meer aanvvezig. In het algemeen is het aantal 
mogeliyke sleutels veel groter dan het aantal gebruikte en het aantal 
besechikbare adressen. Het mogeliike sleutelgebied moeten vve via 
de adresberekening (sleuteltransformatie) afbeelden op het beperkte 
ter beschikking staande relatieve adresgebied. 

Dit proces vvordt genoemd randomizing (sleutelconversie proce- 
dure, sleuteltransformatie procedure) en gaat gepaard met het pro- 
bleem van synoniemehn. Hoevvel deze randomizing van het groot- 
ste belang is voor het slagen of falen van deze bestandsorganisatie, 
is hierover relatief vveinig informatie te verstrekken. Het is ook niet 
mogeliik €en of enkele algemeen bruikbare methoden aan te geven, 
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omdat de optimale keuze afhankeliik is hoe de gebruikte sleutels ver- 
deeld ziin over het gebied van mogeliike sleutelvaarden. 


Voorbeeld: 

Neem aan een bestand van ongeveer 8000 records. De sleutel van 
deze records in een artikelnummer dat bestaat uit 8 decimale ciffers. 
Als primair gebied vvordt een geheugenruimte voor 10000 records ter 
besehikking gesteld en daarenboven een zekere geheugenruimte voor 
overloop. Dat vil dus zeggen dat vi) bi) voorbaat reeds uitgaan van 
een bezettingsgraad van het primaire gebied van ongeveer 8000. 
Bezien vve nu de sleutel. Hiervan is alleen gegeven dat deze bestaat 
uit een getal van 8 decimale ciffers. Zonder verdere toelichting be- 
tekent dit dat alle mogeliike sleutels gevormd vvorden door de getal- 
lenri) van 0 tot 105-1, De 8000 gebruikte sleutels ziin echter niet 
zomaar een greep uit de 108 mogeliikheden. Door vermelding van 
het feit dat de sleutels hier artikelnummers betreffen kunnen vve 
reeds vermoeden dat in iedere sleutel van 8 ciifers enkele codes 
vervverkt ziin zoals biyvoorbeeld fabrieksnummer, fabrikage metho- 
den, priiğsindex, enz. Het gevolg van deze op zich misschien vvel 
logische indeling van artikelnummers is, dat in de verdeling van de 
artikelnummers over de gehele getallenri) van 0 tot 108 hier en daar 
verdichtingen en verdunningen optreden. Zouden vve hier geen reke- 
ning mee behoeven te houden dan zouden vve in dit geval als eenvou- 
dige transformatie kunnen nemen: laat de voorste 4 ci/fers veeg en 
beschouvv de laatste 4 ci/fers als relatief adres. Met evenveel recht 
hadden vve de voorste 4 cif/fers als relatief adres kunnen beschouvven 
en de laatste 4 ci/ifers kunnen vveglaten. 

Het is duideliik dat met een dergeliike transformatie, ook zonder 
statistische berekeningen, bii ongeliy)ke verdeling van sleutelvvaarden 
ook ongeliyke verdelingen van records over het primair toegevvezen 
gebied zullen plaatsvinden. 

Op bepaalde plaatsen houdt men ruimte over, op andere daarentegen 
komt men tekort en dit veroorzaakt de overloop. 


Randomizing heeft tot doel de omrekening van sleutelvvaarden naar 
adressen zodanig te defini€ren, dat ondanks bepaalde systematiek 
in de sleutelsamenstelling, de verdeling van alle records over de 
beschikbare gestelde ruimte statistisch gezien zo gelifkmatig moge- 
lifk vvordt. 

In hoeverre in het hiervoor gegeven voorbeeld het vveglaten van de 
voorste 4 ciffers een iuiste methode is zou alleen een nauvvkeurige 
statistische analyse betreffende het voorkomen van sleutelvvaarden 
kunnen leren. Het is mogeliyk dat dit in sommige gevallen een prima 
bruikbare methode is. 

VVelke berekeningsmethode het beste kan vvorden toegepast, vvordt 
bepaald door de effici€ntie vvaarmee de beschikbare externe geheu- 
genc apaciteit vvordt gebruikt en het aantal daarbii) voorkomende sy- 
noniemen. 
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Adresseringstechnieken 

Vele adresberekeningstechnieken die bi) indirecte adressering gebruikt 
vvorden, interpreteren de bit representatie van de sleutel als een binair 
getal of herleiden dit tot een binair getal. 

Dit zou de eerste stap van de adresberekening kunnen vvorden. 


Onderstaande technieken ziin voor het gemak alleen beschreven voor 
numerieke sleutels. Doel van elke goede adresberekening is een 
gelifikmatige spreiding van sleutels over adressen te berei- 
ken. Voordat een bepaalde adresberekening gekozen vvordt, zal dan 
ook een studie (statistische analyse) gemaakt moeten vvorden van de 
verdeling van feiteliike sleutelvvaarden over het totaal aantal moge- 
lifke sleutels, daarnaast van de opbouvv van elke sleutel, tervvi/l 
men bovendien rekening zou moeten houden met de toekomstige ont- 
vrikkeling van het bestand (vvelke sleutels komen erbi), vvelke zullen 
verdvviinen?). 

Een van de hulpmiddelen om de opbouv van een sleutel te analyseren 
is een ciifer analyse tabel. Deze tabel vvordt vervaardigd 
door het tellen van de frequentie, vvaarmee de ciffers 0 tot en met 

9 voorkomen in elke positie van biifvoorbeeld een artikelnummer. 
Een analyse van deze tabel geeft informatie met betrekking tot de 
verdeling van de ciifers in elke controlepositie. Deze analyse is een 
vvaardevol hulpmiddel bi) het kiezen van een bepaalde techniek bi) 
een bepaalde serie getallen. 

Bifvoorbeeld: 16045 artikelen - controleveld (sleutel) van 8 posities. 


positienummer in controlegetal 
3 4 


0 
1 
2 
Ə 
4 
Ə 
6 
7 
8 
9 


Figuur 8. 
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De volgende voorbeelden geven enige methoden en technieken aan, 
vvelke kunnen vvorden gebruikt om een sleutel tot een diskadres om 
te rekenen. 

Deze voorbeelden pretenderen niet een volledige serie formules te 
ziln, maar een leidraad tot die technieken, vvelke een aanvaard- 
baar resultaat opleveren. 

Een verdelingsanalyse moet in ieder geval vvorden uitgevoerd op het 
gehele bestand vöördat een bepaalde formule vvordt gekozen. De for- 
mule moet vvorden toegepast op ieder artikelnummer van het bestand 
in plaats van steekproeven te nemen. 


A. Extracting 
Gebruik een gedeelte van de bestaande sleutel als basis voor disk- 
adres. 
Bilvoorbeeld: 
24 V/ 356 
53 TP 4152 
63 r 4149 
206 1441 
MVV 5092 
48 T 773 
(s 3560 
45 TP 4959 
67:27 12 
Dit nummer is onderverdeeld op de volgende manier: 
a. Prefix - 2 tekens 
b. Afd.code - 0 - 1- of 2 tekens 
c. Artikelcode - 2 - 8 - of 4 tekens. 
Indien men nullen toevoegt, vvaar een teken ontbreekt, ontstaat het 
volgende: 


67: TN “1700 

Aangenomen, dat de ci/ifer analyse tabel een regelmatige spreiding 
aangeeft voor het artikelnummer, dan zou dit vvellicht kunnen dienen 
als basis voor een diskadres. 


B. Folding (knippen) 

Optellen of omvvisselen van het ene gedeelte van de sleutel met het 
andere. 

De ciffer analyse tabel gaf biyvoorbeeld de volgende resultaten: 
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a. Artikelnummer: Goede verdeling op de drie linkerposities. Slechte 
verdeling op de rechterpositie. 

b. Afdelingscode : Zeer goede verdeling van het numerieke gedeelte 
van de tientallen positie. 

c. Prefix : Goede verdeling van eenhedenpositie. 


Deze verdeling zou tot de volgende methode kunnen leiden: 
1. 24 VVO 3560 
2. 3564 € Basis voor diskadres. 


Het voordeel van zovvel de extracting als de folding methode is, dat de 
berekening niet erg ingevikkeld is. 


C. Vermenigvuldiging (midsquaring) 
De meest eenvoudige methode is kvvadrateren en de middelste cif/fers 
van het produkt als basis voor diskadres te gebruiken. 
Biivoorbeeld: 24VV035607 - 
24.603560 
24603560 
147621360. 
123017800.. 
73810680... 
147621360..... 
98414240...... 
409201120....... 
0605335164673600 
5164 — Basis voor diskadres. 


(neem voor VVO 60) 


Deze methode kan meestal verbeterd vvorden door het gevonden getal 
van vier ciifers te vermenigvuldigen met het artikelnummer. Hier- 
door zal het aantal duplicaten, vvelke door het kvvadrateren ziin ont- 
staan, verminderen. . 

Biivoorbeeld: 5164 x 24VV03560 

In sommige gevallen zal het kvvadrateren van het controlegetal in 
ziin geheel niet het beste resultaat opleveren. Als biivoorbeeld is 
gebleken, dat de vier rechtse posities de beste spreiding vertonen, 
zullen zi) bi) deze techniek hun betekenis verliezen. Indien deze vier 
ciifers met de folding methode naar het midden van het controlegetal 
vvorden gebracht, zal hun betekenis veel meer tot uiting komen. 


D. Deling 

De deelmethode houdt in, dat de sleutel vvordt gedeeld door een con- 
stante. De rest vvordt gebruikt als diskadres. 

De deler is meestal: 
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a. Het aantal bestandsrecords, vvelke ziin toegestaan voor het aantal 
posten in het hoofdbestand. 
b. Het dichtstbiiziinde priemgetal bi/ het aantal uit punt a. 


Het gebruik van een priemgetal vordt aangeraden, omdat dit alleen 
kan vvorden gedeeld door het ciffer 6€n en door zichzelf. De kans, 
dat men vanuit verschillende controlegetallen dezelfde rest verkriigt 
is bi) het delen door een priemgetal veel minder groot. 
Ook een deler, vvelke eindigt op de cif/fers 1 - 3 - 7 of 9 kan goede 
resultaten geven. 
Biivoorbeeld: 
10. 000/24603560/2460 
20000 
46035 
40000 
60356 
60000 
Ə560 — Basis voor diskadres. 


Het dichtstbiizifnde priemgetal bii 10.000 is 9973. 
Hiermee kriigen vee: 
9973/24603560/2467 

19946 


0169 -— Basis voor diskadres. 


De deelmethode geeft in het algemeen aanvaardbare resultaten. Er 
kunnen echter getallen ziin, vvaarbi) deze methode niet zo goed vol- 
doet., Indien vve de volgende getallen delen door 10.000 zouden ze 
alle dezelfde rest opleveren. 

as VVT 5381 

39 VVT. 5381 

483 VVT 5381 nameliik de rest 5381, 

Deling door een priemgetal zou in dit geval betere resultaten geven, 
hoevvel bii deze zelfde methode andere getallen dezelfde rest kunnen 
opleveren. 


E. Distribution method 
Deze methode bestaat uit: 
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Het maken van een verspreidingsanalyse, om van het aantal sleutels 
van een hoofdbestand te bepalen in vvelke groep ze thuishoren. 
Bifvoorbeeld: 


Ə linkerposities van Aantal artikelen 
een artikelnummer in deze groep 
van 7 ciffers 

001 - 099 1076 

100 - 350 3590 

351 - 599 2090 

600 - 799 25970 

800 - 999 1076 


Gebaseerd op deze analyse vvordt een bepaald aantal plaatsen van het 
totale aantal toegekend aan iedere hoofdcategorie. Biivoorbeeld 1090 
van het aantal beschikbare plaatsen vvordt gereserveerd voor die 
artikelnummers, vvelke beginnen met de ci/fers 001 tot en met 099. 
Om de plaats van een artikel in het bestand te bepalen, vvordt intern 
een tabel opgeslagen, vvelke bevat: 

a. De hoogste limiet van iedere categorie. 

b. Beginadres per categorie. 

c. Aantal beschikbare plaatsen per categorie. 


Hoogste limiet Beginadres Aantal beschikbare 
plaatsen 
099 1000 100 
350 1100 350 
599 : 1450 200 
enz. 


De tabel vvordt nagezocht, om van het bestand dat gebied te vinden, 
vvelke het betreffende nummer bevat. 


Nadat het een en ander is vastgesteld nemen vve aan, dat er een 
komma vvordt geplaatst vöör het "Aantal beschikbare plaatsen". De 
overige 4 posities van het artikel van 7 ci/fers vvorden vermenigvul- 
digd met het "Aantal beschikbare plaatsen". 

De decimalen rechts van de komma vvorden vervvaarloosd. Dit pro- 
dukt vvordt opgeteld bi) het "Beginadres" om zodoende een plaats in 
het bestand te bepalen. 

Biivoorbeeld: Artikelnummer 0579748 

057 selecteert beginadres 1000 

9748 x .100 974 

Berekend adres is 1974. 
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Synoniemen en overloop (overflov) 

Bi) vriyvvel elke adresberekeningsmethode zullen meerdere sleutels 

hetzelfde adres opleveren. Hierdoor ontstaan synoniemen: records 

vvier sleutel na adresberekening een adres opleveren, vaar reeds 
een ander record is opgeborgen. Het probleem is dan een geschikte 
opbergplaats voor deze synoniemen te vinden (anders gezegd: "Hoe 
organiseer ie de overflov/?"). 

In principe ziin er tvvee mogeliikheden om synoniemen te relateren 

aan hun eigenliike berekende adres (home-address of huisadres 

(vaak een spooradres) genoemd): 

- Leg synoniemen vast op beschikbare ruimte zo dicht mogeliiyk bi) 
het oorspronkeliik bedoelde schiifadres. 

- Koppel synoniemen door middel van een ketting aan het oorspron- 
kelifke schiifadres. Het record dat op het oorspronkeliik berekende 
adres opgeslagen is, kriigt dan als extra gegeven een vervvilsadres 
naar het eerste synoniem mee. Het eerste synoniem kriigt een ver- 
v/iizing mee naar het tvveede synoniem etc. (een "lege" vervviizing 
is dan een indicatie dat er geen verdere synoniemen ziin) (zie fi- 


guur 9). 


SYNONIEMEN (in geval van indirecte adressering) 


biivoorbeeld artikelnummer 178/73A Track 
136/01C Disk-Adres 12 06 4 
214/122 cil, sector 
ADRES: 


12 06 4 178/73A info 


12 07 6 136/01C 


info 


12 09 4 214/122 info blanco 


Figuur 9: Verveerken van synoniemen met behulp van vervifis- 
adressen. 
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De eerste methode impliceert lineair zoeken: als een record niet op 
het berekende adres aanvvezig is, moet de omgeving nagezocht vor- 
den (bifvoorbeeld: eerst hetzelfde spoor, dan andere sporen van deze 
cilinder etc.). 

De tvveede methode impliceert het biihouden van een vviizeradminis- 
tratie voor de ketting. 


Doel van het adresberekeningsalgoritme en de organisatie van de 
overloopruimte (opslag van synoniem) is het opereren met het be- 
stand zo effici€nt mogeliik te maken. Dit betekent het zoeken van 
een compromis tussen geheugenbeslag en accesstiid (minimalisatie 
armmbevveging bii sehiylven). Een belangriik gegeven hierbii is het ge- 
bruik van een bestand: Bi? een betrekkeliik statiseh bestand, dat veel 
geraadpleegd vvordt, zal het accent op "korte zoektiid" (bifvoorbeeld 
kettingen) liggen. Bi) een snel veranderend bestand (aanvullingen, 
vveglating) zal het accent meer op de "korte opbergti)d" lixgen (zo 
goedkoop mogeliike overflovv-organisatie). 


Parallel aan de bovengenoemde methoden voor synoniemvastlegging 
zifn de volgende tvvee organisaties voor het overloopgebied (beide 
trachten armbevvegingen te minimaliseren): 

- Kies een zo groot mogeliik primair gebied, en een adresbereke- 
ningsalgoritme dat dit gebied "ruim gespatieerd" opvult met records, 
zodat op elk spoor en op elke cilinder voldoende ruimte voor over- 
flovv is. Komt men dan synoniemen tegen dan kunnen deze in eerste 
instantie in hetzelfde spoor als het spoor van het huisadres ge- 
plaatst vvorden en vervolgens op dezelfde cilinder. 

- Kies per cilinder een apart overloopgebied (analoog aan de index- 
sequentiele organisatie) en plaats hierin de synoniemen, vvaarbi) 
alle synoniemen van een huisadres aan elkaar en het record op het 
huisadres gekoppeld ziin door een ketting. 


Nadeel van de eerste methode is, dat synoniemen op andermans 
plaats terecht kunnen komen, omdat de overflovruimte van het eigen 
adres uitgeput is, Vvaardoor een rommelige organisatie ontstaat. 
Indien vve aannemen dat de gekozen adresberekening de geconver- 
teerde sleutels homo geen verdeelt over de beschikbare adressen 
(met andere vvoorden: gemiddeld genomen horen bii elk adres even- 
veel records), dan kan men mert behulp van de vvaarschiinliikheids- 
rekening de kans op synoniemen (of overflovv) uitrekenen. Deze kans 
vvordt meestal uitgedrukt als funktie van de bezettingsgraad of vullings- 
graad. De bezettingsgraad is de verhouding tussen het aantal records 
dat in een bestand aanvvezig is en het aantal records dat maximaal 
opgeslagen kan vvorden in het primaire gebied. 

Bi) een bezettingsgr aad van 100906 van het primaire gebied is de kans 
op synoniemen (overflovpercentage) 377 (dat vil zeggen: ge- 
middeld genomen zal in 37 van de 100 gevallen overflovv optreden). 
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Bi) een bezettingsgraad van 8076 is het overflovpercentage 3100 en 
bi) een bezettingsgraad van 2096 is het overflovrpercentage nog altiid 
97. 


Binning 

Door een speciale techniek genaamd binning (Engels to bin “in 
een kist of ruimte bergen) is het mogelifik het percentage overloop 
te verminderen. Het beschikbare geheugen vvordt dan verdeeld in 
stroken vvaarbii in iedere strook plaats is voor meerdere records. 
Deze stroken vvorden genummerd en deze nummers vormen dan de 
huisadressen. Dit betekent dat per huisadres plaats is voor meer- 
dere records en per strook vvorden de records dan in feite sequen- 
tieel opgeborgen. Het vvordt daarmee een mengsel van directe en 
sequentiele organisatie. Door een handige keuze van deze stroken 
bestaat er echter in de praktiik nauvveliiks bezvvaar tegen het sequen- 
tieel opzoeken. Men kiest nameliik deze stroken veelal geliik aan een 
spoor, zodat huisadressen dan identiek vorden met 
spooradressen. Aangezien men de informatie op 
een spoor door technische omstandigheden toch 
reeds sequentieel moet benaderen vormt deze methode 
op dit punt geen enkel bezvvaar. Een dergelilke strook voor meerde- 
re records vvordt dan vvel genoemd een bin (kist, blok of ruimte) of 
ook vvel bucket. 

Het effect is dat de overloop op bepaalde adressen en de tekorten op 
andere adressen bii grotere ruimte per adres de neiging hebben el- 
kaar vvat op te heffen. Biyfvoorbeeld met maximaal 10 records per 
huisadres bii een bezettingsgraad van 100977 van het primaire gebied 
daalt de overloop van 3706 tot 1376, en bi) 8070 bezetting van 3176 tot 
500. 

De tabel in figuur 10 geeft de kans op overflov/ bi) diverse "bingroot- 
ten" en "bezettingsgraden" van het primaire gebied. Merk op dat de 
overflovvpercentages die hierboven genoemd ziin overeenkomen met 
de overflovrpercentages voor bingrootte 1 (uiteraard1). 

Een bezettingsxgraad groter dan 1 betekent dat de overflov in een 
apart gebied moet vvorden opgeborgen omdat het primaire gebied 
dan te klein is om de records op te nemen. Uit de tabel is ook af te 
lezen dat een flinke bingrootte voordeliger is dan een groot aantal 
kleine bins (vergeliik bii vriivvel hetzelfde overflovvpercentage van 
ongeveer 17.570 een bingrootte van 5 records met een bezettings- 
graad van 1.0 en een bingrootte van 1 record met een bezettings- 
graad van 0.4). 


Een ander voorbeeld van gebruik van deze tabel is het volgende: 
Laat een bestand van 4000 records opgeborgen moeten vvorden op 
een schi/fsysteem met 10 sporen per cilinder en 10 records per 
spoor. Hoeveel cilinders ziin dan nodig als de gevvenste bezettings- 
graad 8006 is? 
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Reserveren vve als eerste poging per cilinder 9 primaire sporen en 
1 overloopspoor dan kunnen in de primaire sporen 0.8 x 9 x 10 - 72 
records een plaats vinden. Het aantal overflovrrecords (als functie 

van de bingrootte) bii deze 72 records berekenen vve als volgt: 


bin bezettingsgraad 
2 03 R 0306 0:7 038” 0.9: 13071 Tə 
1 4.84 9.37 13.61 17.58 21.31 24.80 28.08 31.17 34.06 36.79 39.35 41.77 
2 0.60 2.19 4.49 7.27 10.36 13.65 17.03 20.43 23.79 27.07 30.24 33.30 
3 0.09 0.63 1.80 3.61 5.99 8.82 11.99 15.37 18.87 22.40 25.91 29.33 
4 0.02 0.20 0.79 1.96 3.76 6.15 9.05 12.32 15.86 19.54 23.25 26.93 
5 0.07 0.37 1.12 2.48 4.49 7.11 10.26 13.78 17.55 21.42 25.30 
b 0.02 0.18 0.67 1.69 3.38 5.75 8.75 12.24 16.06 20.06 24.11 
7 0.01 0.09 0.41 1.18 2.60 4.74 7.60 11.04 14.90 19.00 23.19 
0.05 0.25 0.84 2.03 3.97 6.68 10.07 13.96 18.15 22.46 
0.02 0.16 0.61 1.61 3.36 5.94 9.27 13.18 17.44 21.86 
10 0.01 0.10 0.44 1.29 2.88 5.32 8.59 12.51 16.85 21.36 
1 0.01 0.07 0.33 1.04 2.48 4.80 8.01 11.94 16.34 20.94 
12 0.04 0.24 0.85 2.15 4.36 7.51 11.44 15.89 20.58 
14 0.02 0.14 0.57 1.65 3.64 6.67 10.60 15.15 19.99 
16 0.01 0.08 0.39 1.28 3.09 6.00 9.92 14.56 19.53 
18 0.05 0.28 1.01 2.65 5.45 9.36 14.07 19.16 
20 0.03 0.20 0.81 2.30 4.99 8.88 13.66 18.86 
25 0.01 0.09 0.48 1.65 4.10 7.95 12.87 18.31 
30 0.04 0.28 1:23 3.47 “7,25 12.31 17:93 
35 0.02 0.18 0.94 2.98 6.73 11.86 17.66 
40 0.01 0.12 0.73 2.60 6.29 11.53 17.47 
50 0.05 0.45 2.04 5.63 11.03 17.20 
60 0.02 0.30 1.65 5.14 10.68 17.03 
70 0.01 0.20 1.37 4.76 10.41 16.93 
80 0.01 0.13 1.14 4.46 10.21 16.86 
90 0.09 0.97 4.20 10.05 16.80 
100 0.06 0.83 3.99 9.92 16.77 


Figuur 10: Overflovypeercentages bi) diverse bezettingsgraden en 


bingrootten. 
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bingrootte 2 3 4 2) 6 7 8 
overflovv 90 000:47 18.4 32.9: 10.88.80 6o5ə7 
overflov aantal “158 “11 -9 “7 -T -6 -—6 


VVe zien hieruit dat vanaf bingrootte 4 dus 9 of minder records in de 
overflov/ terecht komen, vvat nog in het 10e spoor kan. Bi) bingrootte 
4 hebben vve dan 4000/ 7241 extra overflovvcilinder € 57 cilinders no- 
dig. 


5.3.3 Reorganiseren 


Ook vvillekeurig of direct toegankeliike bestandsorganisaties vereisen 
reorganisatie. 

Zovvel bii directe als indirecte adressering kan dit na enige tiid nodig 
ziln omdat de verzameling van de mogeliike sleutelvvaarden veranderd 
is, dan vvel de verdeling van feitelifke sleutelvvaarden over de verza- 
meling van mogelifke sleutelvvaarden. 

Veelal dient deze reorganisatie gepaard te gaan met de toepassing 
van een ander algoritme voor de conversie van sleutel naar adres. 
Vervolgens kan bii indirecte adressering een te grote hoeveelheid 
synoniemen reden voor reorganisatie ziin. Afhankeliğik van de orga- 
nisatie van het overloopgebied kan het dan ook noodzakeliik ziin een 
ander algoritme voor adresberekening toe te passen. Daarnaast kan 
men de synoniemketens villen reorganiseren teneinde "veel gevraag- 
de" records voor in de ketens te plaatsen. 


5.4 Bestandsmutatfes büi sequentü61e, i4ndex-sequenttöle en 
random bestandsorganılsatTes 


Een bestand is zelden een statisch geheel, gegevens vvorden veran- 
derd, toegevoegd of vervviyderd. De snelheid van veranderen en het 
belang dat men hecht aan het "bi?" ziin van het bestand bepalen de 
frequentie vvaarmee het bestand bii)gevverkt moet vvorden. 

In principe ziin er maar tvvee vervverkingsmethoden: sequentieel 
en direct. 

Bi) sequenti6le of batechvervverking spaart men mutaties op en veerkt 
het bestand bii met het gehele pakket. : 

Bi) directe, in line, on line of postgevviize vervverking brengt men 
elke mutatie op het moment van binnenkomen in het bestand aan. 
Sequenti€le vervverking kan men bii elk type informatiedrager en 
opslagstructuur toepassen. Postgevviize vervverking laat zich prak- 
tisch niet goed toepassen bi) sequenti6öle informatiedragers. De 
keuze tussen de vervverkingsmethoden vvordt bepaald door de toepas- 
singen vvaarvoor het bestand is opgezet. Een vliegtuigplaats reserve- 
ringssy steem zal van minuut tot minuut een biigevverkte stand van 
zaken dienen vveer te geven. Bi? een verkoopmaatschappii moeten 
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toegezegde leverenties direct van de voorraad vvorden afgeboekt, ter- 

vvi)l de fakturering ten behoeve van de uit te leveren goederen heel 

goed in een batch vervverkend systeem kan vvorden uitgevoerd. Zo ook 

zal een bank de actuele saldi van rekeninghouders op elk moment 
geregistreerd vvillen hebben. Als een bepaalde toepassing postgevviize 
vervverking nodig maakt, vvil dat nog niet zeggen, dat de daartoe op- 
gezette bestanden alleen maar postgevvi)s vvorden benaderd. 

De genoemde bank zal de overschriivingen en de produktie van dag- 

afschriften met hetzelfde bestand realiseren, vvaartoe de overschri)- 

vingen groepsgevviis vvorden vervveerkt. 

Hieronder volgt een aantal karakteristieken van batch- of groepsge- 

VVİİZe vervverking: 

- leder programma is een aparte iobstep met eigen 2CL ook voor de 
gebruikte bestanden. 

- Sorteren van input en van tussenfiles is noodzakeliiğk. 

- De te gebruiken bestanden moeten elke ?obstep geopend en gesloten 
vvorden. 

- Het aantal accessen is hoog vanvvege tussenbestanden en omdat vaak 
eenzelide record in verschillende steps vvordt geraadpleegd. 

- Het voordeel van batchvervveerking is, dat bestanden sequentieel 
benaderd kunnen vvorden, Een masterfile is echter vaak zo groot, 
dat random access toch voordeliger is. Masterfiles vvorden vaak 
index- sequentieel georganiseerd. Ook "armpie stelen" doet afbreuk 
aan het batchkarakter. 

- "armp)e stelen". Voor moderne toepassingen moeten veelsoortige 
gegevens snel en vanuit verschillende gezichtspunten toegankeliik 
zi). Dit maakt soms een organisatie nodig die random access toe- 
laat voor bepaalde toepassingen (on-line inquiries biyvoorbeeld), 
tervvi)l voor andere toepassingen sequentieel access sneller is. 

Bi) sequentieel access hoeven immers biyna geen bevvegingen met 
de lees-schriif-koppen gemaakt te vvorden. 

Bi) dit laatste dient voorbehoud gemaakt te vvorden voor het z.g. 
"armp)e stelen". Imdien een file een pack niet vult kan zich in een 
multiprogrammeringssy steem de situatie voordoen dat de sequen- 
ti6le vervverking onderbroken vvordt voor een access naar een ander 
deel van het pack (ten behoeve van een ander programma uiteraard). 
Men moet dan later toch met een soort direkt access terug en ver- 
liest er het voordeel van de sequenti6le verveerking. 

- Elke yobstep kan eenvoudig afzonderliik vvorden getest. Men moet 
dan vvel de input tussenbestanden kunnen vullen en de output tussen- 
bestanden kunnen printen. 

- De herstart mogeliikheden moeten met zorg vvorden nagegaan. 
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Hieronder volgen enige karakteristieken voor transactie- of postge- 

VVİİZe vervverking: 

- De programma-opbouvr volgt het verloop van de transaktie, daardoor 
is het systeem eenvoudiger te programmeren en een modulaire 
struktuur beter te vervvezenliy)ken. 

- Er ziln geen tussenbestanden nodig en ieder permanent bestand 
vvordt maar öön keer per transaktie geraadpleegd. Daardoor is er 
minder 1/O, maar er is vvel steeds random access. 

- Het is niet nodig de input te sorteren. Ook geen tussentiids sorteren 
zoals bi) batechvervverking. Dit voordeel gaat vveer enigszins ver- 
loren als er periodiek een gedrukt overzicht van de transakties ge- 
maakt vvordt (bi/v. voor een archief). 

- Ongestoord gebruik van de partitie, doordat niet steeds iobsteps 
geinitieerd en be€indigd hoeven vvorden. 

- Restart problemen ziin betrekkeliik eenvoudig: een aantal trans- 
akties is afgevverkt, het systeem stokt op een transaktie en een 
aantal is niet afgeveerkt. 

- De overgang naar real time toepassingen is alleen mogelifik vanuit 
transaktiegevviize vervverking. 


m de figuren 11 en 12 ziyin tvvee systeemstroomschema. s getekend 
voor een faktureringssysteem. Het voorbeeld van figuur 11 is uitslui- 
tend te gebruiken voor groepsgevviize vervverking, tervviil het voor- 
beeld van figuur 12 geschikt is voor postgevviize vervverking. Figuur 
13 geeit schematisch nog eens vveer vvat met post- en groepsgevvi)ze 
vervverking bedoeld vvordt. 
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Figuur 11: Voorbeeld fakturering met behulp van een tape-systeem. 
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Figuur 12: Voorbeeld fakturering met behulp van een schiiven-systeem. 
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Figuur 13: Voorbeeld van post- en groepsgevviize vervverking. 
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Is de mutatiefrequentie hoog dan zal men geneigd ziin postgevvilze 
vervverking te kiezen. Dit vereist direct toegankeliike informatie- 
dragers. Het probleem van het vinden van het record is eenvoudig, 
vergeleken bii de problemen van bestandsbiivverking en bestandsbe- 
vvaking. Denkt men aan toepassing van terminals, dan kunnen van 
meer dan een kant mutaties voor hetzelfde record binnenkomen. 

Men ontmoet hier dan ook problemen van deadlock, resource sharing, 
die bii bedriifssystemen behandeld ziin. 

Voorts heeft men bi/ direct toegankeliike bestanden - als men geen 
voorzorgsmaatregelen treft - slechts 6€n versie van het bestand, 
tervvill bi? sequenti€le bestanden men door het type informatiedrager 
noodgedvvongen beschikt over enige versies (grootvader, vader, 
zoon-systeem bii) magneetbanden). VVaar mogeliik zal men bi/ on- 
line-bestanden on-line-vragen toelaten, maar pogen om mutaties op 
te sparen en deze batchgevviis te vervverken. 


Bestand met sequenti6le opslagstructuur 

De vervverkingsvviize is veelal sequentieel. De batchmutaties vvorden 
op hetzelfde criterium (biiyvoorbeeld de sleutel) gesorteerd als het 
bestand. 

Als het bestand op magneetband staat, is vervverking in principe 
simpel: op grond van sleutelvergeliiking vvorden beurtelings vvagens 
(records) uit "trein records oud bestand" en uit de trein "mutaties" 
afgehaakt en na mutatievervverking aangehaakt aan de trein "records 
nieuvv bestand". 

Opschuifproblemen doen zich niet voor, omdat het hele bestand 
al of niet gemuteerd, gecopieerd vordt. 

Bi) een sequentieel bestand op schi/fgeheugen doet zich het opschuif- 
probleem vvel voor. Veelal zal men "veeglatingen" niet uitvoeren, 
maar het desbetreffende record markeren en "toevoegingen" via ver- 
v/iizingen koppelen aan hun eigenliike fysieke plaats. Periodieke re- 
organisatie is dan nodig om vveeer een zuiver sequentieel bestand te 
kriigen. Deze reorganisatie geschiedt vveer vvel met behulp van co- 
pieren. 


Bestand met index-sequentiele opslagstructuur 

Het veranderen van records in een index-sequentieel georgani- 
seerd bestand is op het eerste gezicht een eenvoudige bevverking: 
een record kan direct opgespoord vvorden met de sleutel van het 
transactierecord, veranderd en dan vveer teruggeschreven. Omdat 
mogeliik meerdere mutaties op een oud record moeten vorden aan- 
gebracht is het bi) een hoge file volatility effici6nter om de trans- 
actierecords toch te sorteren op sleutelvolgorde. 


Het toevoegen van records in een index-sequentieel bestand is 
daarentegen niet een simpele bevverking omdat veelal de indextabel 
(1en) bifgevverkt moet(en) vvorden. Vooral vvanneer de toe te voegen 
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records in het overloopgebied terecht komen, moet enige adminis- 
tratie in de tabellen en/ of in kettingviizers in de records in het 
overloopgebied uitgevoerd vvorden. Als het vverkgeheugen te klein is 
om complete sporen van een vvillekeurig toegankeliik geheugensys- 
teem op te nemen, kunnen ingevvikkelde progxramma"s hiervan het 
gevolg ziln. 


Ook het verviideren van records kan aanleiding geven tot het 
biğlhouden van indextabel(len), maar vaak kiest men de oplossing dat 
een overbodig gevvorden record als zodanig "gemerkt", doch niet 
vervviiderd vvordt. 

VVanneer na enige tiid grote aantallen records in overloopgebieden 
terecht ziin gekomen, en/of overbodig gevvorden records flink in 
aantal ziin toegenomen, dan vvel een overloopgebied vol is geraakt, 
moet men mert het oog op toegenomen vervverkingstiyden overgaan 
tot een bestandsreorganisatie. Dit gebeurt door het totale bestand 
in sleutelvolgorde te copi€ren op een nieuvve schiiveneenheid, en 
daarbi) overbodige records te vervviğderen en overloopgebieden leeg 
te maken. Bi) deze vervverking zal veelal tevens een copie van het 
bestand op magneetband vastgelegd vvorden ten behoeve van be- 
standsbeveiliging. 


Bestand met villekeurig toegankeliike opslagstruc- 
tuur 

Bi) een directe relatie tussen recordsleutel en recordadres is de 
techniek voor het vinden van records triviaal, het record is in prin- 
cipe in 6en accesstiid beschikbaar. 

Bi)? een tabelrelatie is de zoektechniek uiteraard dat in de tabel 
(en eventueel de subtabellen) naar de recordsleutel gezocht vordt, 
vvaarna het recordadres bekend is. De zoektiyd in de tabellen is ge- 
middeld van de in de ordegrootte van microseconden als de tabel voor 
n records al in het kernengeheugen aanvvezig is, maar van de orde van 
de accesstiid (milliseconden) als de tabel nog op een secundair geheu- 
gensysteem staat. Om het record zelf in het kernengeheugen te kriigen 
moet een accessti)d opgeteld vvorden. De zoektifd in de tabel, hoevvel 
reeds kort, kan nog vvat verbeterd vvorden door de recordsleutels in 
de tabel te sorteren en dan de binaire zoekmethode te gebruiken. 
(Tegenover een korte zoektiid staat bi) de gesorteerde tabel uiter- 
aard een langere opbouvtiid van de tabel omdat daarin de sleutels 
gesorteerd moeten vvorden. Het aantal keren dat de tabel opgebouvvd 
moet vvorden versus het aantal keren dat de tabel voor een zoekpro- 
ces gebruikt moet vvorden, bepaalt dan de keus tussen gesorteerde 

en ongesorteerde tabellen.) 


Bi) een functionele relatie tussen recordsleutel en recordadres 
moet voor het zoeken van een record uiteraard eerst een sleutelcon- 
versie vvorden uitgevoerd met de sleutel als gegeven. Bi) een ge- 
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schikte "randomizing" methode zal slechts nu en dan een synoniem 
optreden, zodat aangezien de berekeningstiid meestal te vervvaarlo- 
zen is, gemiddeld in (iets meer dan) €€en accesstiid een record be- 
schikbaar zal ziin. Is het aantal synoniemen daarentegen niet te ver- 
vvaarlozen, dan kan voor het zoeken eventueel een groot aantal ac- 
cessen nodig zi)n. 


Samenvattend kan gezegd vvorden dat het probleem meestal zit in het 
vinden van een goede "randomizer", doch dat daarna niet alleen het 
zoeken, maar ook het toevoegen, veranderen of vervvi)deren van 
records vveinig problemen geeft en snel is. Omdat iedere zoek ook 
onafhankeliik van de vorige is, hoeven ook de transacties niet gesor- 
teerd aangebracht te vvorden. Deze bestandsstructuur is dan ook zeer 
geschikt voor "on-line" toepassingen, al zullen zoals reeds eerder 
gezegd door het systeem voorzieningen getroffen moeten vvorden om 
"biina geliiktifdige" mutaties op een bepaald record goed te vervveer- 
ken. 


0.6 Andere bestandsorganf?sattTevormen 
0.5.1 Relatieve bestandsorganisatie 


Bi) deze bestandsor ganisatie is er een relatie tussen de sleutel en 
de relatieve positie van het record ten opzichte van het begin 
van de file. Deze relatie kan simpel zi)n: "de sleutel is het rangnum- 
mer van het record in de file", maar kan ook via een tabel of algo- 
ritme vastgelegd ziyn. 


5.5.2 Inverted file structuren (geinverteerd bestand) 


De tot dusver besproken structuren zi)n min of meer geschikt voor 
"searching", dus voor het vinden van gegevens op grond van de sleu- 
tel van een record. VVanneer het echter om een "retrieval" probleem 
gaat, dat vvil zeggen het vinden van records vvaarvan bepaalde items 
aan zekere voorvvaarden (meestal geliikheid of ongeliikheid) moeten 
voldoen, zit er met de behandelde structuren vaak niet veel anders 
op dan alle records van een bestand te lezen, de items vaar het 
om gaat te onderzoeken en de records die voldoen aan de voorvvaar- 
den vveg te schriiven op een andere informatiedrager. Het volledige 
bestand moet zo doorgevverkt vvorden, hetgeen voor zeer grote be- 
standen kostbaar kan ziiln, 


VVanneer het aantal voor een retrieval relevante items, vermenig- 
vuldigd met het aantal mogeliike vvaarden dat ieder van die items 
kan aannemen, niet al te groot en het oorspronkeliike grote bestand 
vyillekeurig toegankeliğik is, kan een inverted file goede uitkomst 
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bieden. Tn feite is deze te vergeliiken met een trefvvoordensysteem 
van de systematische catalogus van een grote bibliotheek. Men bouvt 
nameliyk bii het oorspronkeliyke bestand een geordend hulpbestand 

- de "inverted file" - op, vvaarvan de recordsleutels bepaald vvorden 
door de namen en mogeliy)ke vvaarden van voor retrieval relevante 
items. De items van de inverted file records ziln dan de (gesorteer- 
de) sleutels (of fysieke adressen) van alle records van de oorspron- 
kelifke file, vvaarvan de corresponderende items aan dezelfde be- 
paalde voorvvaarde voldoen. Een retrievalvraag laat zich met behulp 
van logische and, or en not operatoren formuleren, biyvoorbeeld 
een retrieval van die records in een bevolkingsadministratie beho- 
rende bi) bevvoners die ön getrouvvd ziin ön drie minderiarige öf geen 
kinderen hebben, maar niet een vri) beroep hebben (is deze zin ei- 
genliik zonder gebruik van haak?es vvel €€nduidig te interpreteren?). 
Met behulp van de inverted file vindt men dan direct de recordsleu- 
tels (of recordadressen) van de gevvenste records in het oorspronke- 
lifke bestand, immers in het hulpbestandstuk "gehuvvd" vindt men de 
recordsleutels van alle gehuvvde bevvoners, in het hulpbestandstuk 
"drie minderiarige kinderen" de recordsleutels van alle bevoners 
met drie minder?arige kinderen, in het hulpbestandstuk "nul kinde- 
ren" die van alle bevvoners met nul kinderen en in het hulpbestandstuk 
"vri) beroep" tenslotte de recordsleutels van alle bevvoners met een 
vTi) beroep. Door dan overeenkomstig de retrievalvraag logische 
bevverkingen op de groepen recordsleutels uit te voeren isoleert men 
tenslotte de recordsleutels van de gevvenste records, die dan zo mo- 
gelifk direct opgezocht kunnen vvorden. De groepen recordsleutels 
moeten voor een efficiönte logische bevverking uiteraard gesorteerd 
ziin. 


Geinverteerde bestanden vvorden veelal op de volgende tvvee viizen 

gefmplementeerd: 

- Ten eerste door inderdaad afzonderliike hulpbestanden vvaarbi) 
dan eigenliik gevverkt vvordt met variabele recordlengte, vvant 
ieder record bevat naast de itemvvaarde een variabel aantal adres- 
sen (van records die bi/ deze vvaarde van dit item horen). 

- De tvveede methode is met kettingadressen in het hoofdbestand. 
Voor iedere gevvenste itemvvaarde is in ieder record dan een ket- 
tingadres aanvvezig. Verder vvordt voor iedere itemvvaarde een af- 
zonderliike index bi/)gehouden die het eerste adres van de betrok- 
ken ketting geeft. Ook hier geldt veer dat de kettingen 
niet te lang en het aantal kettingen niet al te groot 
mogen vorden. Een verdere consequentie is dat bii) iedere muta- 
tie zonodig ook de kettingen vveer moeten vvorden biigevverkt. Bi/- 
voorbeeld in het gegeven voorbeeld van vvoonplaatsen moet iemand na 
verhuizing naar een andere stad in een andere ketting vvorden gehangen. 
Zou men in dit voorbeeld het probleem hebben dat relatief veel 
mensen in bepaalde plaatsen vvonen dan zouden daardoor de ket- 
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 tingen lang vvorden. Men moet voor die gevallen dan de index ver- 
fifnen door biyvoorbeeld die vvoonplaatsen op te delen in vviy)ken en 
deze vvi)ken dan als zelfstandige vvoonplaatsen te beschouvven. 

Hoe men dit precies moet doen is in het algemeen niet aan te ge- 

ven en hangt volkomen af van de onderhavige toepassing. 


5.5.3 Keten of kettingadressering 


Liiststructuren, gerealiseerd door middel van kettingen, kunnen 
zoals vve gezien hebben een bepaalde samenhang (biiyvoorbeeld een 
sequenti6le) representeren, zonder dat deze samenhang door een 
fysieke ligging vastgelegd hoeft te vvorden (geen opschuifprobleem, 
vvel periodiek reorganiseren om genoeg vri)e ruimte te kri)gen). 
Vaak zal men naast een keten van records ook een keten van vri)e 
plaatsen biihouden. 


Voorbeeld: 

adres sleutel informatie kettingadres 
1 2355 - 10 
2 488 - 11 
Ə VTİ) - k 
4 1012 - 1 
5 365 - 2 
6 VTİ) - 8 
7 743 2 4 
8 VTİ) - Ə 
9 VTİ) - 6 

10 4768 2 k 

11 513 a 7 

begin recordketting: 5 k: einde ketting 


begin vrif/e ketting : 9 
Ketting op volgorde van opklimmende sleutel, 


Na toevoeging van record met sleutel 3533 en vervviidering van 
record 488 ziet de ketting er als volgt uit: 


adres sleutel informatie kettingadres 


2355 - 9 
VTİ1) - 
VTİ) - 
1012 - 

Əə65 - 
VTİ) - 

743 - 
VTİ) - 


QO — €5 Q 5 Co MK 
— 
Ço HS QO o bo X 
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9 ƏBA ” 10 
10 4768 - .. 
11 ö13 ” T 


Opgave: Ga na of dit fuist is. 


Nadelen van de kettingadressering zi)n: 

- VViizers moeten aan de recordinformatie toegevoegd vvorden. 

- Administratie vri)e ruimte moet bi/)gehouden vvorden. 

- Records komehn kris kras door het geheugen te liggen. Bi/i semi- 
direct toegankeliike geheugens als schiy)vengeheugens vvordt daar- 
door het aflopen van lan ge kettingen inefficiönt (kans op 
vvachten op omvventeling of armbevveging is groot). 

Men kan met name het laatste nadeel opvangen door lange kettingen 

niet als een sequenti€le ri) maar als boom met meerdere niveaus 

op te zetten (zie figuur 14). 


Kettingadressering op beperkte schaal vvordt ook bi) de andere ge- 
noemde bestandsorganisaties gebruikt (bifvoorbeeld om synoniemen 
te ketenen). 


In het navolgende vvorden onder A tot en met D enige voorbeelden 
van de toepassing van kettingadressering behandeld. 


A. Produktstructuurbestanden (Voorbeeld van een relatie 
tussen tvvee bestanden) 
Deze vvorden onder andere toegepast in fabrieksadministraties van 
assemblagebedriiven. Hierbi? vvordt van elke produktsamenstelling 
vastgelegd uit vvelke subsamenstellingen en onderdelen een produkt 
is opgebouvvd. Deze structuur is schematisch vveer gegeven in figuur 
15. In dit voorbeeld is het eindprodukt A opgebouvvd uit de subsa- 
menstellingen E, H en K en uit de onderdelen 1, 4 en 6. Het eind- 
produkt B is opgebouvvd uit de subsamenstellingen E, K, 1? en Z en 
uit de onderdelen 1, 4, 6, 7, 8 en 12. 
Elke subsamenstelling vormt nu een flist" en vvordt tifdens de ver- 
vverking vaak als ö6€en geheel behandeld. Voor een nadere beschou- 
viing van de vverkzaamheden die met deze gestructureerde informa- 
tiebestanden moeten vvorden uitgevoerd beschouvven vve nu uitsluitend 
de methode die betrekking heeft op de onderdelenreserveringen en 
het aanbrengen van vviizigingen in de produktiesamenstelling. 
In figuur 16 ziin hiervoor tvvee bestanden schematisch vveergegeven. 
Ten eerste het hoofdbestand, dat onder andere de voorraad van alle 
onderdelen, materialen en subsamenstellingen vveer geeft en vvaarbi) 
voor identificatie van elk element in het bestand alleen het artikel- 
nummer is gebruikt. Ten tvveede een produktstructuurbestand vvaar- 
in voor elke samenstelling en subsamenstelling een gegeven is op- 
genomen, dat geidentificeerd vvordt met een samenstellingsnummer 
en vvaarin is vastgelegd uit vvelke onderdelen en subsamenstellingen 
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begin laatste 


In tvee lagen zou het er als volgt uit zien 


met 3 lagen schematisch 


Op geliike viize kan men het in 
meerdere nivo"s verdelen. Heeft 
men biivoorbeeld 10000 records 
dan moet men bi? een langgerekte 
keten gemiddeld 5000 schakels af- 
lopen om het gevenste record te 
vinden, 

Zou men de zaak in 4 lagen ver- 
delen (107 “ 10000), dan bevat 
elke deelketen 10 schakels en 
moet men gemiddeld 4 x 5” 20 
schakels aflopen.: 


Figuur 14. 
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het betrokken produkt is opgebouvvd. VVanneer een vverkorder voor 
100 stuks van produktsamenstelling 1 moet vvorden vervverkt, dan 
kan de hiervoor noodzakeliike materiaalreservering als volgt plaats- 
vinden: Met behulp van de indexed-sequential methode vvordt in het 
voorraadbestand de vastgelegde informatie van artikel 1 opgezocht. 
In dit record bevindt zich naast de normale informatie ook een ver- 
v/iisadres naar het biibehorende record in het structuurbestand. In 
dit record is dus de produktsamenstelling van samenstelling 1 opge- 
nomen. De computer kan nu biivoorbeeld berekenen dat 1500 stuks 
van onderdeel 10 nodig ziin. Ook kan een verdere vervverking in het 
voorraadbestand plaatsvinden door in deze vastgelegde samenstel- 
lingsinformatie een vervviisadres op te nemen naar onderdeel 10 in 
het voorraadbestand. Voor elk voorraadrecord en elke samenstel- 
lingsinformatie kan deze vverkvviize vvorden gevolgd. De indexed- 
sequential toegangsmethode tot het hoofdbestand is hier als uitgangs- 
punt gekozen omdat voor het vervaardigen van de biibehorende over- 
zichten onder meer de alfabetische informatie zoals artikelnaam 
nodig is. Tervville van een compacte vastlegging is deze informatie 
uitsluitend in dit voorraadbestand opgenomen. Het vastleggen van 
deze informatie in het produktstructuurbestand zou veel herhalingen 
van informatie tot gevolg hebben, daar bepaalde onderdelen in ver- 
schillende produktsamenstellingen voorkomen. 

Een tvveede bevverking die met deze beide bestanden uitgevoerd moet 
vvorden is het vastleggen van vviizigingen in de produktsamenstellin- 
gen. Stel dat biyfvoorbeeld onderdeel 10 niet bliikt te voldoen en dat 
hiervoor een ander onderdeel is ontvvorpen dat codenummer 85 heeft 
gekregen. Voor het aanbrengen van deze vviizigingen zal men moeten 
beschikken over een toegangsmethode tot alle records in het produkt- 
structuurbestand vvaarin onderdeel 10 is opgenomen. Hiervoor vvordt 
eerst het voorraadbestand met behulp van de indexed-sequential me- 
thode ger aadpleegd en het record van onderdeel 10 bereikt. Daar in 
dit record ook het adres opgenomen is dat vervviist naar het produkt- 
structuurbestand, en vvel naar het eerst c.q. laagst genummerde 
samenstellingsadres vvaarin dit artikel is opgenomen, kan de vviizi- 
ging ook hierin vvorden aangebracht. Tevens komt het vervviisadres 
besehikbaar dat het volgende samenstellingsadres aangeeft vvaar dit- 
zelfde artikel is opgeborgen. Deze verv/iisadresprocedure zet zich 
voort, totdat het laatste samenstellingsadres is bereikt vvaarin on- 
derdeel 10 is opgenomen (zie pif/len in figuur 16). 


Deze methode maakt het mogeliik zeer snel ingevvikkelde procedures 
uit fe voeren. Bi) het gebruik van magnetische bandeenheden of een 
andere bestandsorganisatiemethode ziin voor het uitvoeren van de- 
zelfde procedures meer bevverkingsfasen nodig dan bi) gebruik van 
schiyvengeheugens en deze "list-processing" methode het geval is. 
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Produkt: 


Figuur 15: Structuur produkt samenstelling. 


2.0..... 01: 


Produktstructuurbestand 23. Voorraadbestand 
“ur “Eoegang indexed-sequential 
- z- . “ə 
x. ə 
Cd k...i 


-— ” ö .. .. 
va .3dİTes in adres volgende AZ verviisadres verviisadre 


i 
Asserbly 17 voorraad- assembly vaarin “ naar naar le 
lart 10 15 st bestandı  gebruikt, artikel 1 INFO (structuur assembl1 
axt 12 11-:st.. dadə, zid. artikel 2 R "b: bə 5 
art 24 3 st....id), “idi artikel 3 ə. 185) 
ssembiy 2 ə ün artikel 5 227m:x. i Ad 
art “56 sti236 Yi $d-:- artikel 10 “5.00 6. 
ey tt sy. id: r a artikel 11 25.22 2. 
ssembly 3 artikel 12 20.14 oo 
art 103 3t6...16 38. artikel 13 “uu. E30 
art 5279616 30: sütikəl 17.7”... s id YE ss 
ssembly 12 x. artikel 20 0 : 0.8: 
Enz, xn artikel 24 5.7 5...” 
z” 
” 


55... 


Figuur 16: Structuur bestanden. 
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B. Relatie tussen bestanden 

Kettingadressering is niet alleen zeer nuttig om records binnen een 
bestand in volgorde te houden, maar evenzo om records van een be- 
stand te verbinden met gerelateerde informatie van een ander 
bestand. 

Een voorbeeld hiervan vvordt getoond in figuur 17. Elk artikelrecord 
kan een of meer fabrieksorders hebben die op verschillende tiiden 
tiyidens vervverking ontstaan ziin. Het artikelrecord in het hoofdbe- 
stand is door middel van een "pointer" verbonden met de eerste fa- 
brieksorder voor dat artikel. VVanneer er meerdere fabrieksorders 
ziln dan vervviğst het eerste record naar het tvveede enzovoorts. Op 
dezelfde manier ziin de faktuurliinen van een klant verbonden met 
klantenrecords. Het bestand van vvachtende klantenorders (backor- 
ders) is iets meer gecompliceerd, vvant iedere backorder behoort 
niet alleen bii een bepaald artikel maar evenzo bii een bepaalde 
klant. Er ziin dus theoretisch evenveel kettingen als er artikel- 
records tezamen ziln. 


In figuur 18 liggen deze relaties nog iets gecompliceerder vvant hier 
vvordt niet alleen gevverkt met een ketting, die iedere keer vervviist 
naar het volgende record in de keten beginnend bif het eerste record 
( forvard" of "dovrnvvard" chain), maar ook vvordt er een ketting bi/- 
gehouden, die beginnend bi) het laatste record terugverrvviist tot het 
eerste record bereikt is ("backvvard" of "upvvard" chain). 

VVanneer uit het backorderbestand records vervvifderd moeten vvorden 
zullen ook alle voorgaande en volgende records in de diverse ketens 
gelezen moeten vvorden om de vervviizingen correct te houden. 


C. Toevoegen aan en verviideren uit de ketting 
In figuur 19 vvordt een voorbeeld gegeven op vvelke manier een record 
toegevoegd moet vvorden in een keten. 


1 a. Lees het laatste record van de artikel-backorder keten. Het 
absolute adres kan in het "masterrecord" gevonden vvorden. 

b. Verander het vervviisadres (nu nullen hetgeen einde van de keten 
indiceert) in het absolute adres dat in het geheugen gevonden kan 
vvorden als eerste vrile record in het bestand (NFR — Next Free 
Record). 

, Sehriif de laatste "backorder" terug. 

, Verander het vervviisadres naar de laatste "backorder" in het 
"masterrecord" in het adres dat in NFR gevonden is. 


co 


2 Dezelfde procedure moet gevolgd vvorden voor de klanten "back- 
order" keten. Omdat een terugvvaartse keten nodig is, moet de 
vroegere inhoud van het vervvifsadres naar de laatste backorder 
bevvaard bliiven in een vverkveld (hier genoemd PCR — Previous 
Customer Record). 
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ARTICLE FTLE 


dead 
"eh 
— 


fes 
arməl 0 £z 


—... 
Un 


FACTORY-ORDER FTILE 


CUSTOMER FTILE 


mı 
7:55” 
no e. 


-—.— 
arena ger P 
46 


BACKORDER YFTLE 


Figuur 17: Relatie tussen bestanden. 


Figuur 17: Relatie tussen bestanden. 
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INVOICE-LINE FILE 
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ARTICLE FILE (ind.seq) CUSTOMER FILE (ind.seq) 
iFirst art, Last art :Other First cust Last cu$t Other 
Artno 1 Backorder" BackordelChains iBackorder" Backordef Chains 


55 3001101 1 3001212 xİx m... 3001115 1 3001220 xİx 


BACKORDER FTLE (direc 


— ar i Next custi Previous cust 


: 


İ - k - z xO ric 


irsə İsi İsme 17. 57.” 


3001115 İn 


1: 
/ 
öetnə İcaseii” İ x İsioiziz 10-—-o- 


“o 


“Areno- “yarımı ira KaTb 


£— 


m. 
Artno Custnol—— İ 0-01  0-—----0 İ3001220 3001115 


A ə 


(3007226 7 
Azeno İcusesəl İ x İ:——o İsoszi? 


0----- 0 ce End of Chain 


x e Not relevant in this example 


Figuur 18: Gebruik van kettingen. 
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Firstart Last art 
Backorder Backorder NFR 


ArməT.. İ “ İszsu 
ə 


ld 
iri 3f 
3010506 


Fİrstcusti Last cust PCR 
Backorder Backorder 


Custnl İT x 130231031-—, 3023103 
dəə RŞIŞA 07 0 
2e 
Şextart Nextcust “"vious 
İa Backorder Backdrd Şütkord. 
01005” “— Artno İCustnd İ0----0l x İ x 1) 
Airtno İ Custno “09 15-5— 1—x-... Ara ard 9040916 : — 
İb 
2a 


s 


kremə Tusmol Tv. İsə —— ,, ima — 
2b 


sara 
irtno İCustnd İ 


CORE DISK 


Figuur 19: Toevoegen aan de ketting. 
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, Lees het vrilfe record, vvaarvan het adres in NFR staat. 
, Bevvaar het adres naar het volgende vriie record in een veerk- 


veld (NNFR -— Next Next Free Record). 


, Cre6eer de nieuvve backorder in het outputgebied in het geheugen. 
, Breng het adres opgeborgen in PCR naar het veld "voorgaande 


klanten backorder" in het nieuvve backorderrecord. 


, Sehri/f het geformeerde backorderrecord terug op de plaats, 


vvaarvan het adres in NFR staat. 
Breng het absolute adres van het volgende vriie record van 
NNFR naar NFR. 


4 Trek €en af van de inhoud van een veld in het geheugen dat het aan- 
tal vrife records aangeeft (AFR — Available number of Free Re- 
cords). 


In figuur 20 vvordt een voorbeeld gegeven hoe een record uit het mid- 
den van een keten moet vvorden vervviiderd. 


ia. 


b. 


Lees het te vervvifderen record, het adres staat in het master- 
record. 

Lees het overeenkomstige klantenrecord, de symbolische sleu- 
tel staat in het fuist gelezen backorderrecord (1c). Deze sym- 
bolisehe sleutel kan gebruikt vvorden omdat het klantenbestand 
indexed- sequential geor ganiseerd is. 


. Verander het adres in het artikel masterrecord, dat vervviist 


naar het te vervii)deren backorderrecord, in het adres van de 
volgende backorder, vvelke in het fuist gelezen backorderrecord 
staat (1a) onder "next article backorder". 


Om de ketens (zovvel "dovr" als "up") gerelateerd aan het klantenre- 
cord te herstellen moeten de volgende acties ondernomen vvorden: 


... 


Lees de voorgaande klantenbackorder, het adres hiervan vvordt 
gevonden in de zofuist gelezen backorder onder "previous 
customer backorder", 

Verander het verviisadres in deze backorder (2a), die nu nog 
vervviist naar de te vervviideren backorder, in het adres van de 
nu volgende backorder. Het adres hiervan staat in de te vervii- 
deren backorder onder "next customer backorder". 


, Schri/if de backorder, die gelezen is in 2a, terug. 


, Le€€S met het adres dat staat in "next customer record" in het 


te vervviideren backorderrecord, de volgende backorder. 


, Verander het adres in dit backorderrecord dat vervviist naar de 


voorgaande, in het adres dat in de te vervvifderen backorder 
staat als "previous customer record". 


, Schri/ff de backorder, gelezen in 3a, terug. 
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NFR 
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Figuur 20: Vervvi)deren uit een ketting. 


Figuur 20: Vervvi)deren uit een ketting. 
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D. Gesegmenteerde records 

Dit soort informatie-eenheden die men ook vvel "master and detail 
records" noemt, vvorden vooral toegepast vvanneer in een bestand 
niet alleen de lengte van de records onderling variabel is, maar ook 
de hoeveelheid informatie of het aantal rubrieken per records steeds 
aan veranderingen onderhevig is. Voor het vervaardigen van de 
loonslips kunnen vve in een personeelsbestand biivoorbeeld rubrieken 
aantreffen voor inhoudingen op grond van: verstrekkingen van vverk- 
kleding, schoeisel en dergeliike die gedeelteliik door de vverknemer 
betaald vvorden in de vorm van periodieke inhoudingen op het loon, 
aftrek inspecteur vvanneer belastingvermindering veegens biizondere 
lasten vvordt toegestaan, vvoninghuur indien de vverkgever beschikt 
over eigen vvoningen en deze verhuurt aan ziin vverknemers. 

Het is duideliik dat slechts een beperkt aantal vverknemersrecords 
een rubriek vvoninghuur en aftrek inspecteur zal hebben. Dit geldt 
ook voor de rubriek verstrekkingen, echter met dit verschil dat 
vooral deze rubriek een hoge omloopsnelheid heeft. VVanneer het 
totaal in te houden bedrag f 125,- bedraagt, zal na 5 vvekeliykse in- 
houdingen van elk f 25,- deze rubriek voor de betrokken vverknemer 
voor onbepaalde tiid niet meer nodig ziin. Verder ziin deze inhou- 
dingen voor verstrekkingen, hoevvel van toepassing op biina alle 
vverknemers ook nog over lange periode zeer verspreid in het be- 
stand opgenomen. VVerkkleding zal niet aan alle vverknemers tege- 
lifkertifd en op vooraf vastgestelde data vvorden uitgereikt. Dit is 
slechts een zeer beknopt voorbeeld. 1n de praktiik leidt dit soort 
situaties vaak tot veel grotere variaties in lengte binnen 6€n record 
dan hier tot uitdrukking komt. Voor bestanden die bovengenoemde 
karakteristieken hebben, biedt het gebruik van gesegmenteerde 
records een goede oplossing. Bi?) deze methode vvordt het bestand 
gesplitst in verscheidene bestanden, vvaarbi) elk bestand slechts een 
bepaald deel van de informatie per ondervverp bevat. Met behulp van 
vervviisadressen kunnen dan de diverse informatiesegmenten aan 
elkaar "gekoppeld" vvorden voor vervverking. Elk volledig record be- 
staat dus uit 6en of meer segmenten. Op deze vviize ziin records 
verkregen met een variabele informatielengte. Daar bi) dit soort 
bestanden de informatie steeds in bevveging is, ziin de procedures 
voor het biivverken van het gehele bestand omvangriiker. Ook zal de 
frequentie vvaarmee deze procedures moeten vvorden uitgevoerd 
hoger ziin dan bii andere recordtypen het geval is. Hier staat echter 
tegenover dat met deze aanpak een veel effici€nter gebruik vvordt 
gemaakt van de externe geheugenc apaciteit. 

Zie voor de schematische voorstelling van gesegmenteerde records 
figuur 21. De pi/len geven de functie van de in de "vaste-man" re- 
cords opgenomen vervviisadressen vveer. 
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verstrek- 
kingen 


aza 18 evens van 


ver s €.q. master records 


Figuur 21. 


0.6 Vergelfyiküng van de sequent161e, iündex-sequentüöle en 
direct toegankeliike organiısatte 


Van de drie beschreven bestandsorganisatiemethoden, de sequential 
organisatie, de indexed-sequential organisatie en de random organi- 
satie vvordt bii de laatste tvvee methoden volledig gebruik gemaakt 
van de specifieke mogeliikheden die direct toegankeliike externe ge- 
heugens bieden. De keuze van de methode moet altiğd gemaakt vvor- 
den op basis van de eisen voor alle bevverkingen vvaarbi) het bestand 
betrokken is. Er ziin echter nog andere factoren, die deze keuze 
beinvloeden. Hiertoe behoren de beschikbare computerconfiguratie, 
de mate vvaarin een bestand statisch of dynamisch is, en de omvang 
van het bestand ten opzichte van de externe geheugencapaciteit en de 
aanvvezigheid van standaardprogrammatuur. 

De realisatie van programmatuur op het gebied van bestandsorgani- 
satie is een zeer gecompliceerde zaak. Het betreft nameliyk niet al- 
leen het samenstellen van een programma voor een bestandsorgani- 
satie. Een dergeliik programma moet meestal ook vverken in een 
systeem van multiprogrammering, multivervverking of tiğdscharing. 
Daarbii komen problemen als beveiliging van bestanden toegestaan 
en verboden vvederziids gebruik van bestanden door verschillende 
programma"s aan de orde. Het gevolg is dat die programma s niet 
meer als afzonderliike applicatieprogramma"s kunnen vvorden be- 
schouvvd maar een geintegreerd onderdeel gaan vormen van het ge- 
hele besturingssysteem. Enerziğ)ds vvordt het voor de gebruiker 
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daarmee vriyvvel onmogeliik deze progxramma"s nog zelf samen te 
stellen vvegens de grote programmeringskosten. Anderzi)ds ziin in 
de regel in de gegeven standaardprogramma"s reeds zoveel facili- 
teiten ingebouvvd dat er ook vveinig behoefte is om het zelf te doen. 
Een ingebouvvde faciliteit kan ziin, ingeval men met geblokte records 
vverkt, dat het "blokken" en "ontblokken" reeds in de standaardprogram- 
ma"s is ingebouvvd. Heeft men dan als voorbeeld een index-sequen- 
tieel bestand dat men sequentieel vvil vervverken dan kan men in het 
applicatieprogramma volstaan met iedere keer eenvoudig te vragen 
naar het volgende record tervviil door het standaardprogramma zo- 
nodig ook nog gezorgd vvordt voor parallel buffering (parallelle ver- 
vverking), vvaardoor automatisch transport van en naar achtergrond- 
geheugen kan plaatsvinden parallel met het vervverken van gegevens. 
Aan het gebruik van standaardprogrammatuur is ook nog een ander 
voordeel verbonden. VVanneer men na verloop van tifd overgaat tot 
V/VİİZİiging van de apparatuur, bifyvoorbeeld uitbreiding of vervanging 
van schiivengeheugen, dan behoeft alleen de standaardprogrammatuur 
te vvorden aangepast hetgeen in de regel dan een deel van de levering 
is. Het applicatieprogramma behoeft echter niet te vvorden gevviizigd. 


- Sequentiö6le ververlking is zonder meer mogeliik bi/i se- 
quentiele en index-sequenti6€le bestandsorganisatie vvaarbii zoals 
reeds vermeld standaardprogrammatuur alle bifkomstige veerk- 
zaamheden als "blokken", buffering en dergeliike kan verzorgen. In 
geval van directe bestandsorganisatie hangt de effectiviteit van 
sequentiele vervverking af van de keuze van de randomizing tech- 
niek tervvi/l in de regel de biikomstige vverkzaamheden als blokken 
en buffering door eigen programma"s moeten vvorden gedaan. 

- Directe vervverking is praktisch onmogeliik met sequentiele 
bestandsorganisatie, maar vvel met index-sequentiele en directe 
organisatie, daarbii zal men met directe organisatie meestal iets 
sneller vverken dan met index-sequentiele. 

- Reorganisatie van het bestand is bi) sequenti6€le organisatie 
nodig bi) iedere mutatie. Bi) index-sequenti6€le en directe organi- 
satie zal het periodiek moeten plaatsvinden, vvaarbi) het bii index- 
sequentiöle meer frequent zal moeten gebeuren dan bi/ directe or- 
ganisatie. Daar staat tegenover dat bi) index-sequentiöle men 
meestal gebruik kan maken van standaardprogrammatuur terviil 
bi) directe organisatie men zelf hiervoor zal moeten zorgdragen. 

- Gebruikte ruimte in achtergrondgeheu gen is biina 
optimaal bi) sequentiöle organisatie. Bi) directe organisatie vverkt 
men in de regel met een lagere bezettingsgraad in het primaire 
gebied dan bi? index-sequentiele organisatie. Daartegenover moet 
men bi) index-sequenti6€le organisatie ook rekening houden met de 
ruimte voor de index die ongeveer 10760 kan bedragen. In beide ge- 
vallen komt daar dan nog de ruimte van het overloopgebied bil. 
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- Ten aanzien van het gebruik van primair geheugen 
kan het volgende opgemerkt vvorden: 

Indien men bif index-sequentiele organisatie de indextabellen per- 
manent in het primaire geheugen houdt kan dit een behoorli)ke 
omvang hebben, met het voordeel dat de toegangstiid dan vvordt 
verkleind. Bi/ directe organisatie is primaire geheugenruimte 
nodig voor het programma dat de sleuteltransformatie verzorgt. 

- Viiziging van de sleutelvaarden betekent bil sequen- 
ti6le en index-sequentiele een reorganisatie die vergeliikbaar is 
met normale reorganisaties. Bi? de directe bestandsorganisatie 
kan verandering van sleutelvvaarden het gehele oorspronkelifik ge- 
kozen systeem onbruikbaar maken. In het algemeen is het voor- 
onderzoek naar voorkomende sleutelvvaarden een zeer belangriyke 
en soms een omvangriike zaak bi/i directe bestandsorganisatie. 
Bi) index-sequenti6€le organisatie is dit veel minder kritisch. 

- Variabele recordlengte is geen enkel probleem bi/ sequen- 
ti6le organisatie. Bi) index-sequenti€le kan het enige moeiliykhe- 
den geven maar is in de regel toch nog goed uitvoerbaar. Bi/ di- 
recte organisatie geeft variabele recordlengte vvel de nodige com- 
plicaties doordat hier expliciet van adressen gebruik gemaakt 
vvordt. 

- Bestandsbeveiliging tegen calamiteiten is bii sequenti6ele 
organisatie betrekkeliik eenvoudig door het grootvader, vader, 
zoon-systeem. Bi/ index-sequenti6le en directe organisatie en dan 
in het biizonder bi? directe vervverking van mutaties moet men 
hieraan de nodige aandacht schenken en meestal programmatisch 
gezien ook extra maatregelen nemen, dit kan biyvoorbeeld door 
alle mutaties over een bepaalde periode in een bestand te bevvaren, 
tervvi?l men na afloop van iedere periode een dump maakt van het 
gehele bestand. De tiğdsduur van de periode is afhankeliyk van de 
toepassing en kan vari6ren van enkele uren tot enkele dagen. 


Met de hier genoemde gezichtspunten voor vergeliiking vvordt zeker 
geen aanspraak gedaan op volledigheid. Andere punten komen even- 
tueel vanzelf naar voren indien men in een concreet geval een be- 
paald bestand met biibehorende vervverking op verschillende manie- 
ren tracht te realiseren. 


Index-sequentieel tegenover villekeurig toeganke- 
liik 

Teneinde de keuze enigszins te vereenvoudigen volgen hier de belang- 
riğkste algemene voor- en nadelen van indexed-sequential en random 
bestandsor ganisatie. Daarbi) is uitgegaan van een vergeliylking van 
indexed-sequential bestandsorganisatie met random bestandsorgani- 
satie vvaarbii indirecte adressering vvordt gebruikt. Indien de ran- 
dom organisatie met behulp van directe adressering eenvoudig en 
effici6nt kan vvorden toegepast, is dit te prefereren. 
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De voordelen van de indexed-sequential bestandsorganisatie ziin: 
een compacter gebruik van de externe geheugencapaciteit, eenvou- 
dige sequenti€le vervverking (onder meer noodzakeliyk voor het ver- 
vaardigen van overzichten) en een eenvoudige toepassing bi) het in 
gebruik nemen van een computersysteem, omdat standaardsoftvare 
veelal aanvvezig is. Een uitgebreide analyse van de eigenschappen 
van de identificaties voor het kiezen van een adresberekeningsme- 
thode is niet nodig. 


De nadelen van de indexed-sequential bestandsorganisatie ziin: een 
minder snelle toegankelifykheid tot een record bi/ het vervverken van 
random (niet gesorteerde) transacties. Tevens ziin omvangriikere 

procedures nodig voor het onderhouden van bestanden. De indexta- 

bellen dienen daarbii ook aangepast te vvorden. 


Voordelen van de random bestandsorganisatie ziin: het sneller ver- 
vverken van de transacties en de eenvoudige procedures voor het 
onderhouden van bestanden (geen reorganisaties normaliter, geen 
indextabellen). 


Nadelen ziin: een minder effici€nt gebruik van het schiivengeheugen, 
voor sequenti6le vervverking (overzichten) moet een ketting bi)ge- 
houden vvorden ("gehele file on line") of een sorteerslag uitgevoerd 
vvorden. 

Voorts maken dynamische bestanden de eenmaal gekozen adresbere- 
keningsmethode snel minder effici6nt. 


VVe kunnen concluderen dat de snelheid vvaarmee een transactie "at 
random" vervverkt vvordt, een van de belangriikste verschilpunten 

is fussen een indexed-sequential en een random bestandsorganisatie. 
Vaak is het gevvenst de voordelen verbonden aan het vverken met de 
indexed-sequential organisatiemethode te combineren, zodat daarbil) 
toch een snellere vervverking van randomtransacties vvordt verkre- 
gen. Er ziin verschillende mogeliikheden om dit doel te bereiken, 
vvaarbi) vooral de beschikbare hoeveelheid vverkgeheugen van de com- 
puter een belangriyke rol speelt. VVanneer er voldoende geheugen- 
capaciteit beschikbaar is, kan de cilindertabel tifdens gehele com- 
puterbevverkingen vvorden opgenomen en geraadpleegd in het veerk- 
geheugen. Het lees/ schriifmechanisme van het externe geheugen is 
steeds en uitsluitend beschikbaar voor de records in het te ver- 
vverken bestand. Dit mechanisme behoeft niet steeds heen en vveer 
te bevvegen tussen het bestand en de cilindertabel in het schiivenge- 
heugen. Dit levert een aanzienliike tiidvvinst op. 


Een andere methode om een snellere procedure bi) een bepaalde 
toepassing te krii)gen is het gebruiken van een combinatie van de 
random en de indexed-sequential bestandsorganisatie. In sommige 
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bestanden heeft ongeveer 807) van de mutaties betrekking op slechts 
2072 van de bestandsrecords. Dit bestand kan geheel of gedeelteliik 
indexed-sequential georganiseerd vvorden, vvaarbi) echter tevens 
voor 2096 van de records (de zeer frequente muterende), een afzon- 
derliike adrestabel vvordt opgebouvvd. Deze tabel bevat voor elke 
identificatie zovvel de gegevens voor deze identificatie als het biibe- 
horende schiivenadres. Hi) vvordt tifdens de vervverking van het be- 
stand geheel in het vverkgeheugen van het computersysteem opgeno- 
men en aldaar geraadpleegd. Hierdoor kan nu voor 8096 van de trans- 
acties het bifbehorende schiivenadres direct vvorden bepaald. Een 
nadeel van deze methode is dat het onderhouden van het bestand door 
het gebruiken van deze extra tabel omvangriiker vvordt. Dit nadeel 
is bi) zeer statische bestanden echter beperkt. Het voordeel van 
deze methode is een snellere vervverkingsprocedure dan met de nor- 
male indexed- sequential methode., 


6 BESTANDSONTVVERP 


Als aansluiting op het vorige hoofdstuk en als een van de noodzake- 
lifke gegevens bi)? het bestandsontvverp presenteren vve hier nog eens 
een beknopte vergeliiking tussen de sequenti6€le, index-sequenti6ele 
en direct toegankeliike bestandsorganisatie. 

Figuur 23 vergeliikt ze ten aanzien van de basis-bestandsoperaties. 
In het algemeen kan men stellen, dat het zoeken van een record (en 
daarna er iets mee doen) het snelst opgelost vvordt door de directe 
bestandsorganisatie. Men kan zich echter ook voorstellen, dat veel 
records zoeken aan de hand van hun sleutels toch ongeveer neer- 
komt op het hele bestand doorvverken, zodat voor batchgevviis ver- 
vverken de sequenti6le organisatie zeer goed zo niet de beste is 

(zie figuur 24). 


Opgave: Ga na of de tabel in figuur 22 correct is. 


lage file activity 
hoge file activity 
lage file volatility 
hoge file volatility 
lage file turnover 
hoge file turnover 


-- inefficient “- zeer effici€nt 
“- efficient - matig 


Figuur 22: Vergeliiking van de drie bestandsorganisaties ten 
aanzien van "bestandsdynamiek". 


Om een optimaal bestandsontvveerp te bereiken en om de beste be- 
standsorganisatie te kiezen, dient men aandacht te schenken aan de 
punten genoemd in 6.1 tot en met 6.5. 
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6.1 Gebrulkskarakterfİstteken 
6.1.1 Soort verveerking 


De keuze van de bestandsorganisatie is zeer sterk afhankeliik van de 
soort vervverking. Deze vervverking kan sequentieel of random ziln. 
Opvragingen van gegevens kunnen gebeuren via een sleutel of op 
sleutel tezamen met andere gerelateerde data of op iteminhoud. 

Het ontvverpen van bestanden zal dan ook naar de aard van het soort 
systeem vvaar ze gebruikt vvorden, andere problemen geven. 


Voorbeelden: 


Produktiesector 

De relaties binnen en tussen bestanden, die in de produktiesector 
gebruikt vvorden, ziin meestal tameliik gecompliceerd. De creatie 
van een produktstructuurbestand, de materiaalbehoefte berekeningen, 
het bifhouden van een stuklifist, ziin enkele van de toepassingen in 
deze sector. 

Er bestaan echter uitgebreide standaard softvvarepakketten voor het 
opzetten, biihouden en raadplegen van bestanden in deze sector 
(zoals BOMP van IBM, PRINSYS van Philips etc.). 


Informatieve servicesector 

Het raadplegen van informatie uit een (openbare) "service data bank" 
is zeer gecompliceerd, doordat ieder item of combinatie van items 
binnen een record, sleutel kan ziin vvaarop de informatie geraad- 
pleegd vvordt. Dit probleem vindt men in allerlei bibliotheken of re- 
gisters zoals: personeelsafdelingen, medische gegevens, bevolkings- 
registers, etc. 

Ook hier komen de laatste tifd steeds meer standaardpakketten vaar- 
mee dergeliike bestanden opgezet en geraadpleegd kunnen vvorden. 


Distributiesector 

Deze sector vereist meestal slechts eenvoudige relaties tussen de 
bestanden, maar door de vele kleine variaties in de diverse toepas- 
singen in deze sector, is het moeiliik om hiervoor standaardpakket- 
ten te ontvverpen. Veel eigen ontvverp en programmering zal dan ook 
in deze sector toegepast vvorden, natuurliik zoveel mogeli/k gebruik 
makend van standaard softvvare (voor "blocking" biyvoorbeeld). 


6.1.2 Grootte van het bestand 


Voor omvangriyike bestanden kan het noodzakelifik ziin om dergeliyke 
bestanden te splitsen. Deze techniek vvordt vaak aangeduid met de 
term splitting files. 

Redenen voor het splitsen van het bestand kunnen ziin: 
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- de noodzaak records te kunnen benaderen via andere itemvvaarden 
dan de sleutel van het record (inverted file): 

- indien bepaalde delen van een record slechts zelden vviizigen of 
opgevraagd vvorden kan men overvvegen de "zelden gerefereerde 
recorddelen" in een apart bestand op te nemen ( processing 
ecycle files), 

- indien de configur atie (bifvoorbeeld het kerngeheugen) zo beperkt 
is dat meerdere vervverkingsgangen noodzakeliiyk ziin kan het split- 
sen van bestanden 1/O-tiğid of CPU-tiid verminderen. 

Indien records van een bestand bestaan uit delen, die veel gevraagd 

vvorden en delen die zelden gevraagd vvorden, kan men tvvee behan- 

delingsmethoden volgen: 

- Splits het bestand in tvvee bestanden (bifvoorbeeld een actueel en 
een historisch bestand). In dat geval spreekt men van proces- 
sing eycle files of prime en trailer files. 

- Splits de records niet, maar haal bii mutatieruns de actieve re- 
cords uit het hoofdbestand en vverk deze bi). VVerk vervolgens 
(met een veel grotere periodiciteit) het hoofdbestand bi) met be- 
hulp van dit aldus gevormde hulpbestand. 

In dit geval spreekt men ook vvel over split files. 


6.1.3 Verloop van een bestand (file turnover) 


Het is van belang om te vveten hoeveel records toegevoegd en ver- 
vriğderd vvorden in een bepaalde periode. 


6.1.4 Bedriyvigheid van een bestand (file activity) 


Hierbi?) lette men op: 

- het aantal raadplegingen (accesses): 

- spreiding van raadplegingen over het gehele bestand, 
- records met veel en vveinig raadplegingen. 


6.1.5 Levendigheid van een bestand (file volatility) 


Dit is het percentage records, dat betrokken is bi) vriizigen (up- 
dating). 


— 6.1.6 Gebruiksstatistieken 


Zelden hebben vve de bovengenoemde gegevens ter beschikking, vvan- 
neer vve een bepaald bestand voor de eerste keer opzetten. Een op- 
timaal bestandsontvverp zullen vve daar ook meestal niet bereiken. 
Om na een aantal iaren een optimaler ontvveerp te maken is het nood- 
zakeliyik om statistische gegevens vast te houden. Deze statistieken 
moeten minstens bevatten: 
- het aantal toevoegingen en vervvi)deringen uit een bestand per 
periode, 
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- het hoogste aantal verbonden (keten)records behorende bi? een 
masterrecord over een bepaalde periode, 

- het aantal raadplegingen van elk record afzonderliik over een be- 
paalde periode. 


Het biilhouden van deze statistieken heeft natuurliik extra vervverking 
en plaats nodig, maar vvanneer daardoor na een kortere of langere 
tiid een optimaal bestandsontvverp bereikt kan vvorden, is het zeer 
zeker de moeite vvaard. 


6.2 Soorten bestanden 


Hoofdbestand (master file of permanent bestand) 
Dit is een bestand, vvaarin vvel vviizigingen optreden, maar dat toch 
grotendeels intact bli/ft gedurende een tiid, die lang is vergeleken 
met de tiild tussen tvvee bevverkingen van het bestand. 


Gerelateerd bestand (related file) 
Een gerelateerd bestand bevat records die gekoppeld ziin aan re- 
cords uit een hoofdbestand. 


Geinverteerd bestand (inverted file) 

Een geinverteerd bestand bestaat uit records vvaarin een bepaalde 
sleutel is opgeborgen tezamen met verv/iisadressen naar records in 
een of meerdere hoofdbestanden die alle aan een bepaald criterium 
voldoen. 


Transactiebestand (transaction file) of inputbe- 
stand (mutatiebestand) 

Het transactiebestand bevat de input voor het systeem. Deze input 
zal gebruikt vvorden om hiermee hoofdbestanden te raadplegen of bi) 
te vverken (inquiry en activity records). 


Outputbestand 

Zoals de naam reeds zegt vvorden dergeliike bestanden gecre6erd 

om als inputbestanden te dienen voor andere systemen of verdere 
vervverking binnen een systeem. Een biizondere vorm van een output- 
bestand is een "print"bestand dat als verdere vervverking alleen maar 
afgedrukt vvordt in een bepaald formaat. 


Historisch bestand (history file) 

Als historische bestanden kunnen beschouvvd vvorden vroegere ver- 
sies van hoofdbestanden of transactiebestanden, nodig om het actu- 
ele hoofdbestand te kunnen reconstrueren in geval van een calami- 
teit. Men spreekt ook van historische bestanden vvanneer men gege- 
vens bevvaart die op latere periodieke tiidstippen vervverkt vvorden. 
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Een biizondere vorm van een historisch bestand is het zogenaamde 
totaalbestand (summary file). Op der geliike bestanden vvorden over- 
eenkomstige gegevens uit meerdere periodes gecumuleerd om als 
historische gegevens bevvaard te blifven. 


"Recovery" of "Back-up" bestand 

(Back-up bestand is een vroegere image van het bestand.) 

Zoals de naam reeds zegt, zal een dergeliik bestand alle noodzake- 
lifke gegevens bevatten om de vervverking te herstarten vvanneer er 
een hardvvare of softvvare calamiteit opgetreden is. 

Tiifdens de vervverking vvordt soms ook een log-file aangemaakt. Dit 
bestand bevat in feite niets anders dan de reeds vervverkte mutaties. 
Met behulp van de "back-up" en de 1og-file kan het bestand altiid vveer 
in de toestand vvorden hersteld die het bezat op het moment van 
bovengenoemde calamiteit. 


Data Base 

Een data base is een centrale opslag van gerelateerde gegevens die 
binnen een informatiesysteem gebruikt vvorden en die ter beschikking 
staan voor meer dan EeFöen gebruiker. 

De gebruiker van een data base systeem heeft in ziin programma"s 
in vvezen niets te maken met de fysieke organisatie van een data 
base. De gegevens die hi) nodig heeft vvorden hem door de "Data 
Base Handler" ter beschikking gesteld. Via een "Data Manipulation 
Language" kan hi) ziin verzoeken om gegevens aan deze DBH kenbaar 
maken. 


Primair (prime) en trailer bestand 

VVanneer de items in een record verdeeld kunnen vvorden in veel en 
vveinig gebruikte, kan het bestand in delen gesplitst vvorden. Het 
bestand met de veel gebruikte items vvordt het primaire bestand 
genoemd. De resterende items van het record vvorden dan in een 
trailer bestand opgeborgen. Beide bestanden hebben alle sleutels 
van het oorspronkeliike bestand. 


Partitioned bestand 

Een partitioned bestand bestaat uit onafhankeliike groepen van se- 
quentieel georganiseerde records, members genoemd. Via een 
catalogus (directory) vvorden de namen van memlbers van deze 
file vastgelegd. 

Dergeliike bestanden vvorden vaak gebruikt bi) progxramma- of tekst- 
bibliotheken. 


6.3 Gegevensbepalüng 


De eerste stap in het ontvverpen van een bestand is het vaststellen 
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vvelke informatie het moet gaan bevatten. m de tvveede stap vvorden 

de procedures, die van het bestand gebruik zullen gaan maken, vast- 

gesteld. 

Leg van elk van deze procedures vast van vvelke gegevens ze gebruik 

maken, hoe vaak en vvelke volgorde etc. 

Hierbii moeten vve letten op de volgende punten: 

- Ga voor elk inputgegeven na of de gegevens vvaaraan het refereert 
in andere bestanden, inderdaad aanvvezig ziin. 

- VVeeg het effect van het opslaan van een bepaald gegeven tegenover 
het biyğvoorbeeld elke keer opnieuvv berekenen. 

- Reserveer ook plaats voor gegevens die tiğidens vervverking ont- 
staan, indien vve die gegevens in een later stadium vveeer nodig heb- 
ben (biyvoorbeeld eindsaldo van een debiteur te gebruiken als be- 
ginsaldo voor volgende periode). 

- Onderzoek alle applicaties die van dit bestand gebruik maken, om 
de mogeliikheid van het vergeten van noodzakelifike gegevens te 
verhinderen. 

- Ga de huidige applicaties op hun toekomstige eisen na, dit zou kun- 
nen betekenen dat vve nu al plaats reserveren voor de dan benodig- 
de items. 

- Doe hetzelfde ook voor toekomstig geplande applicaties. Het zal 
veel gemakkeliiker ziin om nu €en of enkele extra velden te reser- 
veren, dan om later de hele bestanden te reorganiseren. 

- Bestudeer de mogeliikheid om bestaande bestanden te consolideren 
in 6en bestand, om zodoende duplicering van gemeenzame gege- 
vens te elimineren (file consolidation). Hierbi) moeten ve 
natuurliik er vvel goed op letten dat de vervverkingstiiden niet te 
veel omhoog gaan. 

- Overtuig u ervan dat de gegevens die in een nieuvve applicatie no- 
dig ziin, vvaarvoor het betreffende bestand ontvvorpen vvordt, niet 
reeds aanvvezig is in een bestaand bestand. 

- Test het bestand, vvanneer het opgezet is, of het voldoet aan de 
eisen die gesteld vvorden door de applicaties, die dit bestand ge- 
bruiken. 

- Voeg die items toe die om technische redenen nodig ziiln, zoals 
extra items in variabele lengterecords. 

- Denk ook aan bestandsnazorg (file maintenance) en interne 
controle eisen. 


6.4 Recordontuerp 
6.4.1 Veldontvverp (field design): fİysieke eigensehappen 
Een veld moet altiğid zo groot ziin, dat het grootst mogelifike aantal 


tekens dat opgeborgen moet kunnen vvorden in dat veld er ook inder- 
daad in past. In sommige gevallen kan men door speciale technieken 
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hiervan afvviiken (record compaction). VVanneer men biivoorbeeld 
vveet dat de eerste tvvee posities van een ordernummer altiiğd nul ziln, 
kan men bii/ het opbergen van een ordernummer in het betreffende 
veld deze nullen ook vveglaten. Omdat bepaalde media zoals biivoor- 
beeld ponskaarten en schiiven (sector, spoor) een vast aantal posi- 
ties bevatten is het zeer essentieel om deze limiet in het oog te hou- 
den om efficiente en praktiseh bruikbare records te ontverpen. 

Bi?) de lengte van velden is ook van belang de soort apparatuur vvaar- 
mee deze gegevens vervverkt vvorden. 2 ğ : 
Dit geldt vooral vvanneer vve vverken met vaste vvoordlengte computers 
vvaarbii niet elke positie van het geheugen adresseerbaar is, maar 
slechts groepen van posities. Dit heeft consequenties ten aanzien van 
het opbergen van alfabetische en alfanumerieke gegevens. 


Bi? variabele vvoordlengte machines of machines die zovvel met vaste 
en variabele vvoordlengte kunnen vverken heeft men nagenoeg geen 
restricties ten aanzien van de veldlengte en inhoud van de velden. 
Altiid geldt dat de velden niet groter moeten ziifn als nodig is, dit 
beinvloedt de recordlengte en daardoor ook de benodigde geheugen- 
capaciteit en de benodigde accesstiiden. Hierbii moet men echter 
vvel zeer goed op toekomstige eisen letten, vvant het is altiid veel 
eenvoudiger om een veld, kiykend naar de toekomst, nu bifvoorbeeld 
al een positie groter te maken, dan om naderhand het hele bestand 
te reorganiseren, hetgeen ook herprogrammering van de bestaande 
applicaties inhoudt. 

Omdat een verkleining van een record altiid positieve resultaten te 
zien zal geven ten aanzien van geheu genc apaciteit en access, moe- 
ten vve altiid inventariseren of niet bepaalde "field compaction" tech- 
nieken toegepast kunnen vvorden zoals: 


- Decimal scaling 

Hierbii vvorden van decimale getallen alleen de significante posities 
opgeborgen, het vaste aantal nullen voor of achter deze signifi- 
cante posities vvordt aangegeven door een positieve respectieveliik 


negatieve scalingfactor. 
Voorbeeld: 
"Scaled" Scaling 
getal factor 
.123 -2 
. 100 3 
"987 0 


- Drifvende kommagetallen (floating point) 

Bi) decimal scaling vvas het aantal scaling posities altiid vast ter- 
vvill bi) drifivende komma het aantal te onderdrukken nullen voor elk 
getal volkomen variabel is. 


Niet 
"gesc led" 
getal 
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De significante posities vvorden in de mantissa opgegeven tervviil de 
exponent het aantal voorafgaande of volgende nullen bevat, 


Exponent / T eken Mantissa 


- VVeglating van de hoogste positie 

VVanneer de maximum getalvaarde voor een bepaald gegeven bi/na 
nooit bereikt vvordt zou men kunnen overvvegen om de hoogste positie 
vveg te laten. Zou het in een bepaald geval toch gebeuren dat het op te 
bergen getal groter is dan de veldlengte, dan kriigen vve automatisch 
een "overflovv" conditie van de computer, die afgetest kan vvorden en 
een overflov/ subroutine, die uitgevoerd kan vvorden. 


- Variabele lengtevelden 

Alleen de significante tekens vvorden opgeborgen, de scheiding tus- 
sen de diverse velden gebeurt door middel van speciale tekens. 
VVanneer vve vverken met variabele lengtevelden kri)gen vve meestal 
ook variabele lengterecords, hetgeen van belang is bif de te gebrui- 
ken bestandsorganisatie en daarmee samenhangende standaardin- 
voer /uitvoer programmatuur (Data Management). 


- Bitting 

Hierbii heeft ieder "bit" in een of meer octaden een eigen betekenis 
of controlefunctie. 

Voorbeeld: Binnen 6€en octade kan bit 1 representeren of actief of 
inactief, bit 2 en 3 uit 66n of vier mogeliğke kredietklassen, bit 4 
en 5 uit 66n of vier leefti)declassificaties. 


- Coding 

Coderen kan gebruikt vvorden om grotere velden te vervangen. 
Voorbeeld: Een €en positie code kan aangeven de maateenheid zoals 
1 voor doziin, 2 voor ons, 8 voor kilo, etc. 


- Heading 

Hierbii vvorden alle gemeenschappeliğke data voor meerdere records 
slechts eenmaal opgenomen, gevolgd door de respectieveliğke detail- 
items. 


- Substituering 

Hierbi) vvorden bepaalde tekens of groepen van tekens vervangen door 
andere, natuurliik met als doel het aantal posities kleiner te maken. 
Voorbeeld: Normaliter zal de maand voorgesteld vvorden in een 
tvveeciiferige code van 01-12. VVanneer vve echter de 10 vervangen 
door 0 en de 11 en 12 door biivoorbeeld A en B komen vee met een- 
"cifferige" code toe. 


- Vormen van field compaction ziin ook nog het gebruik van binaire, 
packed-decimal velden en hexadecimale notatie. 
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VVanneer vve een bepaalde "compaction" techniek vvillen gebruiken 

moeten vve de volgende factoren niet uit het oog verliezen: 

a. Hoeveelheid vverkgeheugen dat de extra routines kosten om de 
codeer- en decodeerfuncties uit te voeren. : 

, De ervoor benodigde tifd. 

, Het compaction percentage dat bereikt vvordt. 

. Compatibiliteit met programmeersystemen. 

. Behouden van de "collating" volgorde. 

. Behouden van vaste veldlengte. 

. Het effect op het totale systeem inclusief de handmatige vverk- 
zaamheden. 


ÜüQ 56820 O“ 


6.4.2 Bepaling van de volgorde van de gegevens 


De volgorde van de gegevens is het meest kritisch voor die bestan- 
den die gecre€erd vvorden vanaf documenten, zoals ponsen van 
kaarten en papertape, terminal operaties, en dergeliike. Alles vvat 
deze vverkz aamheden kan vereenvoudigen verzekert een snellere en 
İuistere creatie, 

Op de volgende punten moet hierbii gelet vvorden: 

- Zoveel mogeliiğk vastleggen van de gegevens in dezelfde volgorde 
als ze voorkomen op het document. 

- Velden met overeenkomstige inhouden in meerdere bestanden zo- 
veel mogeliğk op dezelfde plaats in de records vastleggen, dit ver- 
gemakkeliğkt de sortering en controle van dergeliike bestanden. 

- Sorteervelden aansluitend achter elkaar zetten ("minor" sorteerveld 
rechts en opklimmend tot "mafor" links aangesloten). 

- Compatibiliteit met de data karakteristieken van de te gebruiken 
computer. 

- Het bi) elkaar zetten van alfabetische/ alfanumerieke gegevens, 
vooral in vaste vvoordlengte machines. 

- Bi) gebruik van variabele lengterecords de velden die altiid voor- 
komen altiid op dezelfde posities houden. 


6.4.3 Bepaling van het recordformaat en blokking 


Bi) het selecteren van het recordformaat en de blokking spelen de 
volgende factoren een belangriike Tol: 


- Limiet van het bestand 

Papieren ponsband en magnetische band ziin media vvaarop de gege- 
vens in biina ongelimiteerd grote records kunnen vvorden vastgelegd 
(hierbii natuurliik niet lettend op restricties van het vverkgeheugen 
etc.). 

Ponskaarten hebben een limiet van 80 tot 90 kolommen tervvi)l mag- 
netische schiiven, trommels en dergeliike ook restricties kennen 
door hun opbouvv in sectoren, sporen en cilinders. In theorie is het 
natuurliğik mogeliik om records op dergeliyke media te schriiven die 
groter ziin dan 6en spoor of cilinder maar vve veroorzaken hierdoor 
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zoveel extra progxrammaroutines en vervverkingstiid, dat het op 

pr aktische gronden af te raden is. 

VVanneer vve dan ook een record ontvverpen dat op dergeliifke media 

vastgelegd vvordt, moeten vve op de volgende punten letten: 

- Kies een zodanige recordlengte, dat vvanneer deze records geblokt 
vvorden, het blok nog altiid goed binnen een spoor past. 

- Beperk de maximale lengte voor variabele lengterecords en blok- 
ken ook tot een spoor. 

- VVanneer vve vverken met magnetische schiğiven vvaarvan de sporen 
ingedeeld ziin in sectoren, kunnen vve meerdere sectoren met €en 
opdracht lezen of schriiven zolang vve binnen E€Eön cilinder bliğven. 
Bi) het ontvverp van het bestand moeten vve er voor zorgen dat vve 
niet een aantal sectoren lezen die op meerdere cilinders staan. 
Dit kunnen vve controleren door het aantal sectoren dat vve in öön 
opdracht lezen of schriiven te delen op het berekende aantal cilin- 
ders van het bestand. Het resultaat moet een geheel even getal 
ziin. 


- Eisen te stellen aan het verkgeheugen 

Aangezien door "Data Management Softvvare" alleen fysische records 
gelezen en geschreven vvorden, moet er in het vverkgeheugen een ge- 
bied gereserveerd ziin groot genoeg om een dergeliyk fysisech record 
(blok) te bevatten. Voor een effici€nte vervverking is het meestal 
raadzaam om meerdere van dergeliyke 1/O gebieden te reserveren. 
Buiten deze 1/O gebieden is er meestal ook nog een vverkgebied nodig 
ter grootte van een logisch record. 


- Capaciteit van geheugenmedia 

V/anneer vve fysische records vastleggen op een magneetband, mag- 
netische schi/f en dergeliyke zullen er tussen de vastgelegde records 
niet gebruikte ruimtes ontstaan (interrecord gaps). Dit betekent dat 
vve in geen enkel geval de maximum capaciteit van een geheugenme- 
dium bereiken. 

De meeste plaats verliezen vve bi) het gebruik van ongeblokte records, 
al moeten vve ons tegeliikertiid realiseren dat ongeblokte records het 
gemakkeliyikst te vervverken ziin. Door records te blokken verhogen 
vve de bruikbare capaciteit maar vve verhogen de lees/ schriiftiğd per 
fysisch record. VVe vvinnen echter vveer ti)d per logical record bin- 
nen zon blok, 

In figuur 25 en 26 kunt u een voorbeeld zien van de invloed van blok- 
ken op de capaciteit en de gemiddelde accessti)d. In figuur 27 in een 
andere vorm hetzelfde voor magnetische schiiff. 


- Systeemprogrammatuur ondersteuning 

Elke standaard "Data Management" ondersteunt bepaalde recordfor- 
maten en vvanneer vve niet van plan ziin om eigen programmatuur te 
ontvvikkelen, zullen ve ons bii de bepaling van het recordformast 
moeten houden aan de toegestane. Hetzelfde geldt ook ten aanzien 
van andere standaardprogrammatuur die vve vvillen gebruiken zoals 
bifvoorbeeld sorteerprogramma"s. 
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Effect of Blocking on File Capacity 
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Figuur 25: Relatie tussen blokking 
en de capaciteit van het bestand 
(tape). 
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Effect of Blocking on Average Access 
Time 
Per Logical Record 


Blocking Factor 


Figuur 26: Relatie tussen blokking 
en gemiddelde accesstifd (tape). 
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TRANSMISSİON TİME: İN 
BYTES PER RECORD RECORDS PER MS PER RECORD 
Miyisula Phaxbasir İ. muzr İİ: eyunosn İ mopint İ hiyl İhəSiMuM 1 
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Figuur 27: Capaciteit van magneetschiiven bii verschillende 
fysische recordlengtes en gemiddelde transmissie- 
tifd van de gegevens. 
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Extra attentie is vereist vvanneer vve de bestanden vvillen gebruiken 
op verschillende typen computers. Hierbii is niet alleen het formaat 
van de data records van belang maar evenzeer de formaten van de 
controlerecords zoals identificatierecords (header-, trailerlabels, 
etc. ). 


6.5 Evaluatle van het ontuüerp 


Voordat vve een bepaald bestandsontvverp definitief maken, moeten 
vve eerst de "run"ti)den en daarmee verbonden kosten voor het gehele 
systeem berekenen. Het resultaat hiervan moet vergeleken vvorden 
met de oorspronkeli)ke doelstellingen vvaarvoor het ontvverp is opge- 
zet. . 

VVanneer tiidens deze evaluatie bliykt dat het systeem input/output 

gebonden is (dat vil zeggen de 1/0-tiğd is hoger dan de vervverkings- 

ti)d) kunnen de volgende maatregelen overvvogen vvorden: 

- Creter een tvveede hoofdbestand dat in de records die velden bevat 
die niet gebruikt vvorden in de hoofdvervverking. 

Voorbeeld: Naam, adres, vvoonplaats uit het klantenbestand vvorden 
alleen gebruikt tifdens het afdrukken van de fakturen. Hiervan zou 
een apart NAVV-bestand opgezet kunnen vorden. 

- VVanneer ve met magneetbanden vverken, zouden vve voordat vve 
met de feiteliike vervverking beginnen, de te vervverken records in 
een aparte iob van het bestand kunnen afsplitsen, eventueel tege- 
lifkertiid met het terugsehri)ven van de bii)gevverkte records van 
de vorige run. 

- VVanneer steeds slechts een beperkt aantal records actief is, 
splits het bestand in tvvee bestanden, 6en met de veel geraadpleeg- 
de records en het andere met de overige records. 

- Verhoog het aantal inputbuffers. Hierdoor bereiken vve een grotere 
overlap van 1/0-tiiden en vervverkingsti?d. 


7 CONTROLE VAN HET BESTAND (FILE CONTROL) 


Het ontvverp van een bestand kan niet los gezien vvorden van de om- 
geving vvaarin het betreffende bestand moet functioneren. 

In de volgende paragrafen zullen vve enige controle en "maintenance" 
maatregelen bespreken, die niet alle rechtstreeks betrekking hebben 
op bestanden maar zonder vvelke de bestanden niet goed kunnen func- 
tioneren en beschermd vorden. 


7.1 Interne controle 


Algemeen 

Het gaat om de administratieve interne controle. Het betreft dus dat 
deel van het totale gebied der interne controle dat gericht is op de 
verzekering van de fuistheid van de administratieve registratie en 
de berichtgeving omtrent het bedriifsgebeuren. 


VVil de verantvvoordeliike leiding voor de ?uistheid instaan van de 
verantvvoording en zekerheid geven dat een fuiste basis aanvvezig is 
voor de beslissingsvoorbereiding dan moet de gegevensvervverking 
aan een aantal voorvvaarden voldoen. Zekerheid moet verkregen 
vvorden over: 

- Yuist functioneren van systeem, 

- volledig vervverken van alle gegevens, 

- yuiste basis voor beslissing, 

- inhoud van bestanden. 


Mate van controle 

De controlemaatregelen vvorden beinvloed door: 
- systematiek van de gegevensvervverking, 

- toleranties die de leiding vvil accepteren, 

- doelmatigheidsovervvegingen. 


In een concreet geval zal de behoefte aan beveiliging moeten vvorden 
gedefinieerd. Hiervoor zal een keuze gemaakt moeten vvorden uit 
besehikbare controlemethodieken. 
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Plaats van controle 

Bi) de informatievervverking kan men een aantal fasen onderkennen, 
vvelke ook in het controleproces een belangriike rol spelen, bifvoor- 
beeld: 

- de invoer, 

- de vervverking door de computer, 

- het gebruik van de geproduceerde gegevens, 

- de correctieprocedure, 

- maintenance systeem, 


Een belangriyk gedeelte van de controle zal plaats moeten vinden in 
de computerprocedure, vvaardoor automatisch een berichtgeving 
ontstaat omtrent de door de computer geconstateerde afvviikingen 
van vooraf vastgestelde normehn. Indien de gesignaleerde afviikingen 
een gevolg ziin van fouten in de standaard softvvare of verkeerde 
bediening van de computer ziin deze van speciaal belang voor het 
vervverkingscentrum. Indien zi) echter betrekking hebben op fouten 
in de ingevoerde gegevens of de programmering zelf, ziin deze van 
belang voor degene die verantvvoordeliiyk is voor het systeem van 
informatievervverking. De geconstateerde fouten zullen daarom, 
afhankeliik van de soort fout, moeten vvorden nagegaan door speciaal 
daarvoor aangevvezen functionarissen van het vervverkingscentrum, 
of van de voor het systeem verantvvoordeliike afdeling. 

Van groot belang is ook dat de als onderdeel van een systeem beno- 
digde correctieprocedures op zichzelf zeer goed gecontroleerd vvor- 
den. 


Testen van de controle 

Het is zeer belangriifk dat tiydens het testen van het programma ook 
de fuiste vverking van de ingebouvvde en geprogrammeerde controles 
vvordt nagegaan, iets vvat in de praktiyk nog al eens (gedeelteliik) 
vvordt ver geten. De testgevallen zullen dus bevust fouten moeten be- 
vatten om ook de controles te onderzoeken. 

Het is ook noodzakelifik om een gedeelte van de testgevallen en de 
testproduktie door iemand anders dan de programmeur te laten sa- 
menstellen. 


Accountantsdienst 

Het verdient aanbeveling om met de accountant onder vviens controle 
het informatiesysteem valt, van te voren overleg te plegen omtrent 
de vvensen vvelke hi) eventueel kan hebben over in het systeem aan 
te brengen controles. 
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Reconstructie na fouten 

Tot de controlemaatregelen kunnen ook vvorden gerekend die, vvelke 
nodig ziin om in geval van onverhoopt verlies de verloren gegane 
gegevens te reconstrueren. Hiertoe vvordt meestal de grootvader - 
vader-zoon-conceptie gebruikt. De zoon bevat de nieuvve stand, de 
vader de vorige stand en de grootvader de vveer vöör de vader lig- 
gende stand. Ingeval nu bii vervverking van mutaties biyvoorbeeld 
de oude (“€ vorige bestand “ vader) vvordt beschadigd, kan door mid- 
del van de bevvaarde grootvader en de mutaties van de vorige ver- 
vverkingsrun de vader vvorden gereconstrueerd. 

Bi) het gebruik van magneetband ligt de hier genoemde conceptie 
voor de hand, omdat daar nooft het oude bestand vvordt overschreven, 
maar een nieuv bestand op een nieuvve band vvordt opgebouvvd. Bil) 
het gebruik van andere hulpgeheugens vvorden van het oude bestand 
alleen de gemuteerde standen gevviizigd. Hier vvordt dus de vader 
tot zoon gemaakt en kan men de oude stand bevvaren door biğyvoor- 
beeld vöör de vervverking de oude stand op een magneetband te dum- 
pen. Indien het aantal gemuteerde standen niet al te groot is, kan 
een snelle reconstructie vvorden verkregen door tiğ)dens de verveer- 
king de gemuteerde standen ook op een magneetband te plaatsen. 
Gaat er iets mis, dan vvordt eerst de inhoud van de dumptape in het 
hulpgeheugen geplaatst en daarna de gemuteerde standen, er is dan 
dus geen herhaalde bevverking van de gegevens nodig. 


7.2 Imgebouude controles 


Onder ingebouvvde controles vvorden niet alleen verstaan de door de 
computer verrichte automatische controles op de fuiste veerking 
van de hardvvare, maar ook de controles vvelke in door de fabrikant 
geleverde en eventueel in eigen bedriif ontvvikkelde standaardpro- 
gramma"s ziin vastgelegd. 

Deze controles vvorden ook vvel "machine gerichte controles" ge- 
noemd. 


1,.2.1 Hardvare 


Hardvvare controles kunnen vvorden onderverdeeld in de volgende 

vier soorten: 

- Controle op de fuiste vverking van de in- en uitvoereenheden. Hier- 
toe behoren biyvoorbeeld: dubbel lezen (ponskaart- en ponsband- 
lezer), hole count (ponskaartlezer en -ponser), echo check, papier 
op (printer), lezen na schriiven (magneetband, hulpgeheugen), ge- 
broken band, begin en einde band, protectiering (magneetband), 
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controle of gevonden adres klopt met opgegeven adres (schiiven- 
geheugens en dergeliike). 

- Controle op geldigheid en pariteit tifdens in- en uitvoer van gege- 
vens. 

- Controle op de fuiste vverking van de centrale eenheid. Hiertoe be- 
horen biyvoorbeeld: pariteitscontrole bii transport van karakters, 
geldigheid van de opdrachtecodes, geldigheid van de geheugenadres- 
sen, indicatoren voor niet normale condities (overflovv, en derge- 
lifke), geheugenprotectie bi) multiprogrammering. 

- Controle op de goede vverking van het gehele computersysteem. 
Hiertoe behoren biy)voorbeeld: temperatuur en relatieve vochtig- 
heid in de computerruimte, rookontvvikkeling in de computerruimte, 
electriciteitsstoringen, smeltveiligheden, automatische uitsechake- 
ling van alle delen van de computer indien genoemde condities ge- 
vaar voor beschadiging opleveren. 


7,2.2 Standaard softvare 


De mate van controle in de standaard softvvare is afhankeliyk van de 
fabrikant en van het gebruik van de softvvare. Door het meegeven van 
parameters kan de gebruiker veelal zelf bepalen vvelke ingebouvvde 
controle hi) al of niet gebruiken vvil. Onderstaand volgt een overzicht 
van de meest gebruikelifke, in de softvvare als standaard gebouvvde 
controles. 


Programma- en bestandsidentificatie 

Deze controles behoren tot het zogenaamde "housekeeping" of initia- 
liseringsgedeelte van het programma. De controle op uitvoering van 
het yuiste programma is soms visueel (uittikken op de consoleschrii/f- 
machine), in andere gevallen, vvaarbi) de programma"s door de com- 
puter uit een programmabibliotheek (van magneetbanden of schiyven) 
vvorden gehaald, test het monitorprogramma of vvel het iuiste pro- 
gramma is ingevoerd. 


De controle op de fuiste bestanden is iets moeiliiker. Er moet niet 
alleen gecontroleerd vvorden of het fuiste soort bestand aanvvezig is, 
maar ook of het van de fuiste datum of periode is (denk aan de groot- 
vader-vader-zoon-conceptie). Het eerste blok met gegevens van 
een bestand vormt daartoe meestal de "header-label". Deze bevat, 
naast de naam van het bestand, het codenummer van het bestand, de 
datum van de laatste vervverking of een periodenummer, het se- 
quencenummer (indien het bestand op magneetband meer dan 6€en 
reel beslaat), de bevvaartermiin en het haspelnummer (reelnummer). 
Als parameters moeten aan het standaardprogramma meegegeven 
vvorden het codenummer van het bestand en de datum of periodenum- 
mer van de laatste vervverking. Voor de te schriy)ven magneetbanden 
bovendien de datum van vervverking. Bi) de invoer vanaf ponskaarten 
Of ponsband bevat de eerste kaart of blok een identificatie. 
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Volledigheids- en volgordecontrole 

Tot de volledigheidscontrole van magneetbanden behoren de zoge- 
naamde block-, record- en hashtotals. Tiidens het schriiyven van de 
magneetband vvorden tellingen bi)gehouden van het aantal gesehreven 
blokken en records en soms tevens van (biivoorbeeld) de eerste tien 
posities van elk record. 

Deze gegevens vvorden aan het einde van de vervverking als "trailer- 
label" op de magneetband geschreven. Bii het lezen van deze mag- 
neetband vvorden dezelfde tellingen biigehouden en dan het einde van 
de vervverking vergeleken met de tellingen in de "trailer-label", 
Geliike uitkomsten vvaarborgen een volledige vervverking van het be- 
stand. Aan het einde van de vervverking bliğikt dus of het volledige 
bestand is vervverkt. Indien dit niet zo is, kan men nagaan vvelke 
gegevens niet vervverkt ziin. Om dit te controleren zal men ziyn toe- 
vlucht moeten nemen tot geprogrammeerde controles. 

Bi) gebruik van bestanden op schiiven en dergelifke is de hierboven 
besehreven methode alleen mogeliyk bii het opbouvven en dumpen van 
het bestand en niet bii de normale vervverking. 


Bi) het gebruik van standaardprogramma."s voor de in- en uitvoer 
van gegevens vvorden ook dergeliike methoden gebruikt. Bi/ invoer 
zullen de controletotalen als laatste meegegeven moeten vvorden 
door middel van een sluitkaart (ponskaarten) of sluitblok (ponsband) . 
Deze totalen moeten dus tiğ)dens het ontstaan van de gegevens opge- 
bouvvd vvorden. (Opm. : Dit kan ook tot de systeemgerichte controles 
gerekend vvorden.) 

Ingebouvvde volgordecontroles vindt men praktisch alleen bi? de 
standaard sorteerprogramma"s. Deze kan op opeenvolging (3 na 3 
enzovoorts) of opklimmende of afdalende volgorde geschieden. 

De volledigheid vvordt na elke sorteerfase gecontroleerd. 


Checkpoint and restart 

Hieronder vvordt verstaan dat op bepaalde momenten of vvanneer be- 
paalde punten tiidens de vervverking vvorden bereikt, de gehele sta- 
ties van de ?ob en de inhoud van het veerkgeheugen vorden vast- 
gelegd op een hulpgeheugen, meestal een magneetband. Indien de 
vervverking tot dat moment goed vvas verlopen, dan gaat de computer 
door tot aan het volgende "checkpoint". Is dit niet het geval dan gaat 
de computer terug naar het vorige checkpoint en begint van daar af 
vveer opnieuvv. Een dergeliike procedure deelt in feite een (meestal 
langdurend) programma in een aantal aparte en onafhankeliike stuk- 
ken en ieder stuk vvordt aan het einde gecontroleerd. Er kan gecon- 
troleerd vvorden op subtotalen, hashtotalen en der geliike. Gaat er 
tussen tvvee controlepunten iets verkeerd (biivoorbeeld met de hard- 
vvare) dan kan ook teruggekeerd vvorden naar het laatste goede con- 
trolepunt. Bovendien biedt deze techniek de mogeliikheid om lang- 
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durige programmafs af te breken voor programma"s met een hogere 
prioriteit, aan het einde van de vverkdag, bi/ niet gepland maar plot- 
seling noodzakeliik onderhoud, etc. 


Het herstarten (terugkeren naar het voorgaande controlepunt) kan 

als volgt geschieden: 

- Magneetbanden vvorden teruggespoeld tot dit voorgaande punt. 

- De inhoud van schiiven- en andere hulpgeheugens vvordt terugge- 
bracht naar de toestand, zoals deze vvas op het moment van het 
controlepunt vaar naar teruggekeerd vvordt. (Om dit te kunnen, 
moet dus vanaf ieder controlepunt de oude toestand van de gemu- 
teerde standen bevvaard vvorden, biflvoorbeeld op magneetband of 
een vri) stuk schiifgeheugen.) 

- Kaartlezers, printers en dergeli)ke moeten met de hand aangepast 
vvorden. 

- Het veerkgeheugen moet vveer in de toestand, zoals deze vvas bi) 
het voorgaande controlepunt, hersteld vvorden. 


Schriif- en leesfouten 

Bi) het sehriiven op een magneetband vvordt getest (hardvvare: read 
after vvrite) of vvel goed geschreven is. Indien dit niet het geval is, 
vvordt de band tot het laatst goed geschreven blok teruggespoeld en 
vvordt opnieuvv getracht te schriiven. Dit vvordt meestal een paar 
maal geprobeerd. Lukt het dan nog niet, dan vvordt een klein stukie 
magneetband overgeslagen en daarna pas het blok vveggeschreven. 
Bi) het lezen van de band merkt men hier niets van, er is alleen een 
vvat grotere "inter-record-gap". 

Ook bi? het lezen van magneetband vvorden controles uitgevoerd of 
deze goed gelezen vvordt. In het geval van "read-errors" vvordt ook 
meermalen getracht het betreffende blok te lezen. Indien dit dan nog 
niet lukt, kan (door middel van vooraf aan de standaard softvvare 
meegegeven aanvviizingen) gekozen vvorden tussen afdrukken van het 
foute blok op console-typevvriter of printer, vvegschriiven van het 
foute blok op een aparte magneetband of domvveg overslaan van het 
blok. 

Een andere foutenmogeliiykheid is dat het gelezen blok niet de lengte 
heeft vvelke vooraf in het programma is opgegeven ("vrrong length 
record"). In dat geval vvordt niet herhaald gelezen, vvel bestaat de- 
zelfde keuze van behandeling van dit foute blok als bii "read-errors". 


7.8 Geprogrammeerde controles 


Algemeen 

Geprogrammeerde controles ziin 6en van de belangriikste vormen 
van interne controle bi) geautomatiseerde informatievervverking. 
Enerziids vvorden controles geprogrammeerd vveelke in de plaats 
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komen van die, vvelke voorheen op traditionele vvifze vverden verricht, 
anderziids vvorden geheel nieuvve controles mogeliik vvelke voorheen 
om praktische redenen niet vverden toegepast. 

Geprogrammeerde controles ziin noodzakeliik omdat bepaalde vroe- 
gere controles, vvelke bifvoorbeeld vvaren gebaseerd op afstemming 
van tussentotalen, door het meer geihtegreerde karakter van de 
computervervveerking niet meer mogelifk ziin. Ook de normale men- 
seliifke beoordeling van het ci/fermateriaal komt te vervallen, vvaar- 
door de vviize van vervverking steeds onpersoonliiker vvordt. 

Bi) het maken van een programma mogen de controles niet het sluit- 
stuk vormen, vvaardoor men bif geheugen- of tiğdgebrek controles 
laat vervallen. Geprogrammeerde controles vormen een vveezenliike 
noodzaak in het programma. 

Geprogrammeerde controles leidden ook (evenals ingebouvvde) tot 
signalen. Deze signalen mogen echter niet dan bi) hoge uitzondering 
leiden tot het stoppen van de computer. 

Indien mogeliy)k, moet de geprogrammeerde controle zodanig vvorden 
uitgevoerd, dat, indien niet op een signaal vvordt gereageerd, tiidens 
de volgende run een herhaald signaal vvordt gegeven. De controle 
immers heeft pas zin, indien er op de eventuele signalen ook de no- 
dige actie volgt. 


7.38.1 Invoercontroles 


Programma"s, vvelke speciaal de invoer controleren, vvorden vvel 

"screening" programma"s genoemd. Er is op dit gebied nau vveliiks 
van enige standaardisatie sprake en dus is er ook geen standaard 

softvvare voor. Alle hieronder genoemde controles moeten vvorden 
geprogrammeerd, behalve soms de reeds genoemde identificatie- 
en volgordecontrole. 


Plaatscontrole 

Hieronder verstaat men: 

- het controleren van ieder karakter en veld of dat overeenkomstig is 
met het opgegeven type: numeriek of alfabetisch, 

- het controleren van de fuiste plaats van ieder veld, 

- het controleren van de lengte van ieder veld. 

De beide laatste controles ziin vooral van belang indien geveerkt 

vvordt met invoer gegevens van variabele lengte. 


Limietcontrole 

Hiermede vvordt bedoeld het testen of een bepaald gegeven niet onder 
en/of boven een bepaalde norm komt. Indien deze normen niet abso- 
luut ziin, kan het vaststellen hiervan moeiliik ziin. Stelt men ze te 
nauvv, dan volgen er teveel signalen, stelt men ze te ruim dan is er 
geen voldoende controle. Deze vorm van controle komt ook voor op 
resultaten van met de computer gedane bevveerkingen. 
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Volgordecontrole 

Naast de reeds in het vorige hoofdstuk genoemde volgordecontroles 
komen ook volgordecontroles binnen 6en gegevensgroep voor. Er 
kunnen biivoorbeeld meerdere soorten mutaties voorkomen voor een 
artikel in het voorraadbestand. VVanneer 6en van die mutaties zou 
ziin "blokkeer" dit artikel voor alle mutaties, dan moet deze mutatie 
ook als eerste aanvvezig ziin vöör alle andere mutaties op dit artikel. 


Geldigheidscontrole 

Deze kan gebruikt vvorden om bifvoorbeeld de geldigheid van mutatie- 
codes te testen. Hierbi) moet opgemerkt vvorden dat altiid op alle 
mutatiecodes getest moet vvorden. Ziin er drie mutatiecodes, dan 
mag niet vvorden volstaan met slechts op tvvee te testen en, als deze 
het niet ziln, maar aannemen dat het de derde is. Ook op deze laat- 
ste moet getest vvorden. 


Afhankeliikheidscontrole 

Het komt meermalen voor dat de inhoud van een veld afhankeliik is 
van €öen of meer andere velden. Als veld A is ingevoerd dan moet 
veld B ook gegevens bevatten. 


Volledigheidscontrole 

Bi) de machine gerichte controles is al genoemd de sluitkaart en 
dergeliike. De volledigheidscontrole op een gedeelte van de invoer 
(indien deze zeer veel gegevens bevat) kan vvorden verkregen door 
tussentotalen bii de invoer mede te geven. Dit kan een garantie ziyn 
voor volledigheid van alle of een aantal gegevensgroepen, maar be- 
hoeft niet aan te duiden dat zi) per gegevensgroep volledig is. Indien 
per gegevensgroep moet vvorden gecontroleerd kan gebruik vvorden 
gemaakt van voorgetelde en bii de invoer meegegeven totalen of 
hashtotalen per gegevensgroep. 

Deze controle vveegt vooral zvvaar voor tabellen, vvelke in een pro- 
gramma vvorden gebruikt en vvelke vele mutaties ondergaan. Deze 
tabellen kunnen onderdeel van het programma ziyn voor constanten, 
of door het programma als invoer tiidens de initialisering vvorden 
gelezen. In dit laatste geval moet een volledigheidscontrole, bif?- 
voorbeeld in de vorm van een sluitkaart vvaar het totaal aantal kaar- 
ten van de tabel op staat, plaatsvinden. Bi? vviiziging moet ook deze 
sluitkaart veranderd vvorden, zodat ook altiid een controle met de 
hand plaatsvindt. 


Self-checking codes 

Aan kengetallen (sleutelvvoorden, keyvvords, codes) vvorden soms 

6en of meer controleci/fers toegevoegd, zodat met een redeliike 
zekerheid de geldigheid van de combinatie kan vvorden vastgesteld. 
Indien biyvoorbeeld de ponsmachine voorzien is van een "self-checking 
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number device" kan de geldigheid van de geponste code vvorden vast- 
gesteld. Meestal kan dan slechts €€en controleciifer aan de code vvor- 
den toegevoegd. Indien men een nog grotere mate van zekerheid vvil 
verkriigen moeten meer controleciffers vvorden toegevoegd. De con- 
trole kan dan plaatsvinden in de computer. 


7.3.2 Controle op de vervveerking 


Enkele van de in de vorige paragraaf genoemde controles kunnen ook 
toegepast vvorden tiğdens de vervverking. De limietcontrole komt vel 
eens voor op de uitkomst van een bevverking, vooral bi) vvetenschap- 
peliike toepassingen. Naast de hieronder genoemde controles hangt 
het van het systeem af, vvelke andere eventueel nog geprogrammeerd 
kunnen vvorden. 


Vierkantscontrole 

Een van de oudste bekende controles in de boekhouding is de vier- 
kantscontrole ("crossfooting"). Indien in 6€en liist een afstemming per 
regel mogelifik is, moet ook het totaal van alle kolommen afstembaar 
ziln. Ofvvel de som van de totalen per regel moet gelifik ziin aan de 
som van het totaal per kolom. 


Audit trail 

Hieronder vvorden alle documenten en vastleggingen verstaan vvelke 
het mogeliik maken vast te stellen hoe een bepaald saldo of totaal 

tot stand gekomen is of hoe het is samengesteld. Het begrip is ontstaan 
omdat bii vele computertoepassingen de individuele posten niet meer 
in het systeem vvorden bevvaard. In de conventionele administratie 
heeft men veelal de beschikking over een historisch overzicht, vvaar- 
op alle mutaties ziin vastgelegd. 

Het kan noodzakeliik ziin, dat het systeem toch moet voorzien in de 
mogeliykheden om totalen of saldi op te bouvven uit een vorige stand. 
Men kan hiertoe aan de hand van de mutaties en de saldi aan het eind 
van de vorige periode een staat maken (met de computer) vvaarop 
staan vermeld oud saldo, mutatie(s), nieuv saldo. Deze methode is 
nogal duur en zi) zou daarom kunnen vvorden beperkt tot die gedeel- 
ten vvelke belangriik ziin. 

Een andere methode, vvelke vvel leap-frog vordt genoemd, is om 
bii het afdrukken van een mutatie een vervviizing te geven naar de 
vorige mutatie. Bi? faktureren biyfvoorbeeld kan men het faktuurnum- 
mer onthouden bi? de gegevens van een gemuteerd artikel, Komt er 
bii een volgende faktuur vveer een mutatie van dit artikel voor, dan 
vvrordt het onthouden faktuurnummer van de vorige mutatie hierbi) 
afgedrukt en het nieuvve faktuurnummer vveer bi) de gegevens van dat 
artikel gevoegd. Op deze vvi)ze ontstaat er een sprongsgevviize ver- 
VVİİzing naar de opvolgende mutaties van het betreffende artikel. 


8 DATABASES VOLGENS CODASYL CONCEPTIES 


8.1 In1etding 


In moderne bedriyven en organisaties speelt de uitvvisseling van infor- 
matie - de communicatie - een voorname en algemeen erkende rol, 
Deze informatie-uitvvisseling kan direkt ziin: gesprekken, briefvis- 
seling. Vaak echter komt de informatie-overdracht indirekt tot stand: 
de informatie vvordt vastgelegd en bevvaard voor (mogeliyk) gebruik 

op een later tiydstip. 


Vooral bii de indirekte informatie-overdracht vvordt onder andere 
automatische informatie-vervverking met behulp van computersyste- 
men toegepast. Hierbi) vvordt de informatie vastgelegd in de vorm 
van gegevens (data), vvelke voor een computer leesbaar en hanteer- 
baar zifn. 


De laatste iaren heeft zich een versnelde ontvvikkeling op het gebied 
van de gegevensvervverking en -opslag voorgedaan, niet zozeer ten 
aanzien van de technologie van de opslagmedia (afgezien van de pri/s- 
ontvvikkeling), maar ten aanzien van de toepassingen en de daaruit 
voortvloeiende vviize van denken over gegevensvervverking. 

Beschouvt men de ontvvikkeling van de gegevensvervverking en -opslag 
dan kan men daarin globaal drie fasen onderscheiden: 


1. De eerste fase veerd geheel bepaald door de technische mogelifğk- 
heden. Zii vverd gekenmerkt door sequenti6le vervverking en se- 
quentiele opslag omdat de ekonomisch haalbare hardvvare- en soft- 
vvare-technieken slechts deze vviize toelieten (magneetband, pons- 
band, ponskaaTt) . 


2. De tvveede fase kenmerkt zich door de introductie van opslag en 
raadpleegtechnieken, vvelke typisch gebaseerd zi/n op de techno- 
logie van vvillekeurig toegankeliike opslagmedia (disk, drum). De 
ontvvikkeling van bestandsorganisatie-technieken vverd sterk be- 
paald door de toepassingen, maar vvaren in vveezen alle variaties op 
de index-sequenti6ele en de directe bestandsorganisatie. Daarnaast 
bleef uiteraard de sequenti6€le methode bestaan. 


Beide fasen hebben gemeen, dat de toepassingsmogeliikheden zeer 
sterk bepaald vvorden door de mogeli)ke programma- en bestands- 
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organisatie-technieken. Deze gebruiksmogeli)kheden en -beperkingen 
dringen dan ook sterk door in de organisatie en informatie-vervver- 
king van de uiteindeliike gebruiker. 


Ook bliğven de programmeurs van een toepassing belast met alle 
technische aspecten van de gekozen bestandsorganisatie. Het 
gevolg is gevveest dat bestanden in het algemeen voor individuele 
toepassingen ontvvorpen ziin vvaarbii de structuur van het bestand en 
de gekozen vviize van vervverking doorgedrongen ziiyn in het applicatie- 
programma. İIndien gegevens voor andere toepassingen nodig ziiln, 
kan men kiezen uit tvvee mogeliğykheden: 


a) Copieren van de gegevens uit het bestand in een eigen bestand, 
vaarvan men de structuur en verveerkingsvviize zelf bepalen kan. 


b) Het bestaande bestand gebruiken, vvaarbii de vriy)heid van program- 
meren danig beperkt vvordt door de vastgelegde opzet van het be- 
stand. 


Hoevvel op dit moment vele gerealiseerde en hier en daar ook te rea- 
liseren geautomatiseerde systemen voor informatievervverking zich 
nog in fase 2 bevinden, tekent zich duideliyk een nieuvve aanpak af. 


ə, De huidige inzichten ten aanzien van gegevensvervverking en -op- 
slag gaan uit van de gedachte dat gegevens niet gezien moeten 
vvorden vanuit 6en enkele toepassing of bedriifsfunctie. Imtegendeel, 
gegevens vormen Yuist de verbinding tussen bedriifsfuncties, aan- 
gezien hun primaire doel is "het uitvvisselen van informatie". 
Tevens is er een duideliyke tendens, technieken voor de gegevens- 
vervverking te ontvvikkelen, vvelke de gegevensvervverking vanuit 
de uiteindeliike gebruiker gezien, zo natuurliik mogeliiğk doet 
plaatsvinden: de gebruikersbehoeften bepalen in sterke mate soort 
en vorm der toe te passen technieken, 


8.1.,1 Databases 


Deze inzichten en tendensen vvaren aanleiding tot het concipi6ren van 
het begrip "database" en de database-technieken. 


Een database kan misschien het beste omschreven vvorden als: 


Een gemeenschappeliike verzameling van met 
elkaar samenhangende gegevens ende relaties 
hiertussen, vvelke tegeliikertiid toegankeliyk ziin 
voor verscheidene eindgebruikers. 


m deze omsechriiğving is een aantal essenti6le aspecten benadrukt: 

- De database is de gemeenschappeli)ke verzameling. D. v.z. 
de opgeslagen informatie is voor gemeenschappelifik gebruik en 
dient voor de communicatie tussen gebruikers. 
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- De database bevat de samenhangende gegevens en hun 
relaties - de in de database opgeslagen gegevens representeren 
zoveel mogeliğk de "natuurliike" informatiepatronen, vvaarmee de 
eindgebruikers vertrouvvd zi)n. 

- Verschillende gebruikers kunnen tegeliikertiid toegang ver- 
kri)gen tot de database. Aangezien immers de database gemeen- 
schappeliyk is voor de communicatie tussen gebruikers, zullen 
deze ook zo min mogeliyk op elkaar moeten vvachten, maar ?uist 
zoveel mogeliiyk tegeliyk in de database hun informatie moeten kun- 
nen vinden c. q. opslaan. 


8.1.2 Eigenschappen van database systemen 


Met bovenstaande punten ziyn eigenlifik de belangriikste eigenschap- 
pen van een database systeem genoemd. 

Toch dient ook een aantal additionele eigenschappen genoemd te 
vvorden, vvelke ook bepalend ziin voor de bruikbaarheid van een data- 
base: 


1. Data organisatie - data onafhankeliikheid 
Een database systeem moet de "atuurliike" structuur der infor- 
matie op gemakkeliiyke en flexibele vvifze kunnen representeren. 
Hierbi) moeten overbodige duplicatie en aanvullende systeeminfor- 
matie voor de gebruiker overbodig ziln. 
De data organisatie mogeliikheden moeten onafhankeliik ziğyn van 
het gebruikte computersysteem of de toe te passen programmeer- 
talen. 


2. Data manipulatie 
Een database systeem moet een voldoende aantal benaderings- 
methoden omvatten, zodat een eindgebruiker op eenvoudige viize 
ziin informatie in de database kan onderbrengen en kan terug- 
vinden. Hierbii moet hii de informatie op zo natuurli)k mogelifike 
vvilze kunnen identificeren, c.q. op zo gemakkeliik en effici6nt 
mogeliğke vviize ziin informatiebehoefte kunnen omsechri/ven. 


38. Opslagstructuur - opslag onafhankeliikheid 
Een database systeem moet effici€nte technieken bevatten om de 
logische structuren op de fysiek beschikbare opslagmedia effici€nt 
te kunnen vastleggen en benaderen, zonder de logische structuur 
gevveld aan te doen. 
Deze opslag en benadering moeten op eenvoudige vviize aan ver- 
anderende benaderingspatronen en frequenties kunnen vvorden 
aangepast, zonder dat de gebruiker hiervoor ziin benaderingis- 
methode hoeft te veranderen. 
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10, 


ə Gemeenschappeliik gebruik 


Een database systeem moet het mogeliik maken dat meer dan 6en 
gebruiker tegelifkertiid in de database vverkzaam kan ziin. Hier- 
bii dient het systeem efficiönte mogeliikheden te bieden om ge- 
bruikers te vriylvvaren tegen tegenstri)digheden vvelke door elkaars 
aanvvezigheid in het systeem kunnen ontstaan. 


ə Bescherming (privaocy) 


Een database systeem moet de opgeslagen informatie beschermen 
tegen oneigenliik of ongeautoriseerd gebruik. 


,. Betrouvbaarheid 
Een database systeem moet garanderen dat ingebrachte informatie 
onvervormd bevvaard blifift en teruggevonden kan vvorden. 
Een database systeem moet de gebruikers voldoende mogeliik- 
heden bieden de logische fiuistheid der opgeslagen informatie te 
bevvaken en te toetsen, 
,. Herstelmogeliikheden 
Een database systeem moet voldoende mogeliikheden bieden om 
de database - of beter de informatie - na het optreden of ontdekken 
van een fTout of storing zo snel mogelifk veeer in de iuiste staat 
terug te brengen. 
. Herstructurering 
m een database systeem moet de opgeslagen informatie, zovvel 
qua inhoud als qua structurering op betrekkeliik eenvoudige vviize 
aan veranderende gebruiksomstandigheden kunnen vvorden aan- 
gepast. 
. Beheer 
Een database systeem moet een aantal hulpmiddelen bieden om: 
- De database eenvoudig te kunnen cre6ren, onderhouden, 
reorganiseren. 
- Nieuvve gebruiksbehoeften (programma"s) te testen zonder de 
betrouvvbaarheid van de database inhoud aan te tasten. 
- De database inhoud op beschikbaarheid, betrouvrbaarheid en 
effici€ntie te testen, 
- De gebruiksgevvoonten en -frequenties te registreren. 
Uitvisselbaarheid 


Een database systeem moet garanderen dat bii vernieuving of 
verandering der gebruikte systeemtechnieken en hulpmiddelen, 
de invloed op bestaande gebruikersprocedures minimaal ziyln, 
c.q. dat deze procedures tenminste nog correct bruikbaar ziiln, 
hoevvel deze dan misschien niet de additionele mogeliikheden ten 
volle benutten. 
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8.1.3 Database Management Systemen 


Database systemen als zodanig vvorden bepaald door de gebruiks- 
omgeving van een database. m totaliteit is een database, dus het 
database systeem gebruiksgebonden. Deze gebruiksgebondenheid 
vvordt echter bepaald door de informatie-inhoud en -structuur en 
door de gevolgde informatie-gebruikende procedures van de uitein- 
deliyike gebruikers. 

De specifieke opslag- en benaderingstechnieken en de hulpmiddelen 
ziin veel algemener van aard. Daarom is er, analoog aan de situatie 
rond de conventionele bestandsorganisaties, een scheiding ontstaan 
tussen toepassingstechnieken (application softvvare) en database 

sy steemtechnieken (database system softvvare). De programmatuur 
en technieken voor deze laatste categorie vvorden meestal aangeduid 
als: Database management systemen (DBMS). 


Een aantal DBMS-pakketten is op de progxrammatuurmarkt verkriig- 
baar, zoals biifvoorbeeld: 

TOTAL 

PHOLAS 

DMS 1100 

SYSTEM 2000 


8.1.4 Codasyl DBTG 


Aangezien vele van deze pakketten onafhankeliik van elkaar ontvvik- 
keld ziin, volgen zi) meestal eigen concepties. Maar bii de opkomst 
der database mogeliikheden ziin er ook duideliik stromingen ontstaan 
om algemeen aanvaardbare concepties en technieken te ontvvikkelen. 
Een der groeperingen van gebruikers en fabrikanten, die dit trachten 
te bereiken, ziin de database subcommittees van de CODASYL 
organisatie: database task groups DBTG. CODASYI zelf is een over- 
koepelende organisatie van gebruikers en fabrikanten, die tracht 
algemene programmeertalen en technieken te defini6ren. Deze 
Conference on Data Systems Languages bestaat sinds 1959 en is het 
meest bekend door haar eerste grote vverk: de formulering van 
COBOL. Sinds het eind der zestiger iaren houden subcommittees 
zich bezig met de formulering van database technieken en talen 
hiervoor, 


Een eerste voorstel hiertoe vverd neergelegd in een rapport, ver- 
schenen in oktober 1969. Dit rapport vverd uitgebreid bediscussieerd 
en een groot aantal vviizigingsvoorstellen vverd ingediend. 
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De vervverking hiervan en verdere uitdieping der idee6n resulteerde 
in een tvveede rapport in april 1971. Dit rapport veerd viğ)d en ziid 
verbreid. Diverse fabrikanten hebben dan ook DBMS systemen ont- 
vvikkeld, gebaseerd op de voorstellen in dit rapport. 

Voorbeelden ziln: 

DMS 1100 van UNIVAC 

PHOLAS van Philips 

UDS van Siemens 

mmiddels ziyn nieuvve verbeterde voorstellen verschenen in 1975. 


Ook andere concepties voor database behandeling vvorden ontvvikkeld. 
Zo geniet de benaderingsvvi)ze "relational database" tegenvvoordig 
ruime bekendheid. De grondslag voor deze benadering berust op de 
principes van mathematische relatie theorie en veerd als zodanig 

het eerst voorgesteld door E.F. Codd. 


De verdere behandeling van database technieken in dit hoofdstuk is 
echter gebaseerd op de CODASYL DBTG voorstellen van april 1971, 


8.1.5 Database talen 


In het algemeen onderscheidt men tvvee fundamentele categorie6n van 
database management systemen. 

De ene categorie vvordt gevormd door systeem programmatuur en 
"gebruikerstalen" vvelke een uitbreiding vormen voor de gebruiks- 
mogeliykheden van een bestaande hogere programmeertaal: 

De applicatie-programmeur beschriyft de procedures voor informatie- 
vervverking in termen van een "uitgebreide" programmeertaal. De 
basistaal vvordt dan gastheer taal (host language) genoemd en 

het database management systeem een gastheer taal systeem 
(host language system). 

De andere categorie database management systemen vvordt gevormd 
door de systemen, die rechtstreeks door de eindgebruiker aanspreek- 
baar ziyn zonder de tussenkomst van computerprogramma"s. Deze 
systemen noemt men vvel opzichzelfstaand (selfcontained) . 


De CODASYIL-voorstellen gaan uit van gastheer systemen omdat 
deze benadering meestal algemener en elementairder kan ziin. De 
opzichzelfstaande systemen kunnen met behulp van een gastheer 
systeem gemaakt vvorden. Algemeen kan gesteld vvorden, dat de 
gastheer taal systemen dichter bii het computersysteem staan, de 
opzichzelfstaande systemen dichter bi) de uiteindeliike gebrui- 
ker, 


De gebruiker (programmeur) hanteert de database management 
mogeliykheden door "taaluitdrukkingen": 
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1. De informatie en informatiestructuur vvorden gedefinieerd met 
behulp van een: 
Data defini€6ringstaal (Data definition language - DDL) 
De taal is zelfstandig en niet afhankeliik van een gastheer taal. 
Zie ook paragTaaf 8. 2.6. 


2. De opslagstructuur vvordt gedefinieerd met hetzii hiervoor geschikte 
elementen uit de DDL (CODASYL DBTG 1971), hetzi) door een 
apart hiervoor ontvvorpen taal: 

- Device Media Control Language DMCL 
(voorgesteld door CODASYL DBTG 1971 als concept, maar niet 
uitgevveTkt). 

- Opslagısstructuur taal (Storage Structure Language SSL) o.m. 
door PHOLAS van Philips. 

De taal is zelfstandig en niet afhankeliik van een gastheer taal. 

Zie ook paragraaf 8.3.3. 


3. Het opslaan en de vervverking van de informatie vvordt bestuurd 
door toevoeging van geschikte taalelementen aan een gekozen 
gastheer taal - de data manipulatie talen (data manipulation 
language - DML). 

Het CODASYL-DBTG voorstel vverkt dit concept uit voor de gast- 
heer taal COBOL. 
Zie ook paragraaf 8.5.4. 


Vooralsnog ziin geen algemene taalelementen voorgesteld voor addi- 
tionele hulpmiddelen voor database beheer en herstel. Diverse 
fabrikanten volgen hier hun eigen inzichten. 


8.1.6 Voor- en nadelen 


Het zal vvellicht duideliik ziin, dat het toepassen van database tech- 
nieken een aantal voordelen voor de uiteindelii)ke gebruiker (en de 
programmeur) oplevert, 


- Gecoördineerd beheer van de (gemeenschappeliğ)ke) informatie in 
een gebruikersomgeving en de gemakkeliğke bereikbaarheid van 
deze informatie, 


- Het verband tussen informatie-eenheden behoeft niet meer door de 
gebruiker moeizaam tussen de gegevens gelegd te vvorden, maar 
kan ook in de database vastgelegd vvorden. 


- Vermiiden van het op verschillende manieren en op verschillende 
plaatsen vastleggen van dezelfde informatie, zodat ook de proble- 
men van het in overeenstemming houden van deze verschillende 
representaties vermeden vvorden. 


- Door de fysieke opslagtechnieken niet tot de eindgebruiker te laten 
doordringen, kan deze zich concentreren (en beperken) tot de voor 
hem 1ogische en natuurliike hantering der informatie. 
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- Eenvoudiger bescherming der informatie tegen ongeoorloofd ge- 
bruik en betere controle-mogeliikheden voor iuist gebruik. 


- Uitgebreider en natuurliiker mogeliikheden om een behoefte aan 
informatie te formuleren. 


- Informatie-opslag onafhankeliğik van van te voren reeds bekende 
informatie gebruiksbehoeften: de informatiestructuur laat ook 
informatie-gebruik toe, die niet ten ti/fde van het database ontverp 
voorzien vverd. 


Toch is er ook een aantal nadelen te noemen. Deze nadelen zullen 
bi) gebruik op de koop toe genomen moeten vvorden, of men moet 
voldoende maatregelen treffen om ze acceptabel te doen ziln: 


- De centralisering der informatie en de uitgebreide mogeliikheden 
tot informatie-opslag en -vervveerking kunnen veroorzaken dat een 
bedriif of organisatie in ziin functioneren zeer afhankeliik vvordt 
van de goede vverking van een database systeem. 

Problemen met een database kunnen dan de oorzaak ziin dat het 
bedriif komt stil te liggen. Hiertegen helpt de verhoging der be- 
trouvybaarheid niet afdoende. 

Alternatieve vervangings- en uitvviilkmogeliikheden moeten ook 
aanvvezig zim. 


- Het gemeenschappeliik gebruik der database kan ongevvenste invloed 
uitoefenen op de resultaten van een individuele benadering. Het 
systeem moet hiervoor de nodige regulerende mogeliikheden be- 
zitten. 


- De geihtegreerde informatie in een database is meestal complexer 
dan de geautomatiseerde informatievervverking vöör de toepassing 
der database. 

Hierdoor is het informatievervverkende systeem lastiger te beheren. 


Ook zuiver menseliy)ke factoren kunnen een nadelige invloed hebben: 
- De natuurlifike vveerstand tegen iets nieuvvs en vreemds. 


- Verlies van (vermeende) eigendomsrechten op opgeslagen infor- 
matie. 


- Applicatie-programmeurs hebben minder invloed op database ont- 
vverp. 


- Door de eenvoudiger programmeer-mogeliikheden vrezen pro- 
grammeurs overbodig te vvorden. 


De praktiyk vvifst echter uit dat de belangriykste vrinst voor een orga- 
nisatie bii het gebruik van een database systeem gevonden vvordt in 
de discipline en controle op de informatievervverking die ontstaat 
door de inspanning en de organisatie nodig om het systeem op te 
zetten en te ondersteunen. 
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8.2 Data organisatte ün databases 
8.2.1 Entiteitenmodel 


Voor de vastlegging van informatie in databases gaat men veelal uit 
van het zgn. entiteitenmodel: 


Men onderkent in een organisatie, vvaarvoor informatie in een data- 
base opgeslagen moet vvorden, de basiseenheden en begrippen. Bilv. 
in een verkooporganisatie de klanten, de artikelen, de be- 
stellingen, de afleveringen, de medeverkers, etc, 

Dit ziin allemaal personen, tastbare dingen, of re6le zaken, zovvel 
concrete voorvverpen als abstracte begrippen. Ze hebben echter allen 
gemeen, dat zi) - in de betreffende organisatie - als "re6le feiten 
des levens" onderkend vvorden. Deze vvorden met een algemene term 
entiteit (of obiect) aangeduid. 

Voor de goede gang van zaken in de organisatie is het nodig om in- 
formatie uit te vvisselen over deze entiteiten. Hiervoor moeten ve 
de entiteiten kunnen omschriiven. Dit doen vve door vastleggen van 
de eigenschappen (attributen, proporties) van de entiteiten, 

die voor ons doel belangriik ziin. Een eigenschap veordt gekenmerkt 
door tvvee grootheden: 

- eigenschaptype - de naam van de eigenschap 

- eigenschapvvaarde. 


Bifv. Een eigenschap van een persoon is, dat hi) een naam heeft. 
Een andere eigenschap is ziin adres: 


Eigenschaptype Eigenschapvvaarde 
naam van een persoon - GANSEN 
adres van een persoon - HOOFDSTRAAT 3 


Als vee dus een lifst van bi) elkaar horende eigenschappen opsommehn, 
d. vv, z. een lifst van eigenschaptypen met biibehorende vvaarden, dan 
duiden vve hiermee een entiteit aan. Voorbeeld: 


Eigenschaptype Eigenschapyvaarde 
naam QOANSEN 
adres HOOFDSTRAAT 3 
vvoonplaats HAARLEM 
geboortedatum 15-7-1928 

etc. 


resultaat entiteit persoon 2ANSEN" 
(informatie over de man zelf) 


Als vve alleen de liist van eigenschaptypen beschouvven, dan kunnen 
vve alleen constateren, dat hiermee een persoon omschreven kan 
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vvorden, M. a. vv. de lifst van eigenschaptypen kenmerkt het enti- 
teittype. 

De liist van bifbehorende eigenschapvaarden duidt een verschi?- 
ningsvorm (occurrence) van het entiteittype aan. 


Resumerend kan gesteld vvorden dat entiteiten en eigenschappen als 
volgt omschreven vvorden: 


eigenschap —ə eigenschaptype, eigenschap- 
vvaarde 

entiteit ——ə ecntiteittype, entiteit-verschii- 
ningsvorm 

entiteittype —ə liist van (relevante) eigenschap- 
typen 


entiteit verschi)ningsvorm —ə liist van bi/ de eigenschappen 
behorende vvaarden. 


Alle eigenschappen van een entiteit kunnen gebruikt vvorden om een 
entiteit aan te duiden - te identificeren. 

m de praktiyk zi/fn echter vaak enkele eigenschappen hiervoor vol- 
doende, Voorbeeld: 


Entiteittype Eigenschaptype 
persoon naam 
adres 
vvoonplaats 
geboortedatum 
salarisnummer 
salaris 


"Naam-adres-vvoonplaats" zal in veel gevallen 
de entiteit voldoende identificeren, evenals 
"salarisnummer". 


Hiervan maken vve gebruik om informatie over een entiteit te vveten 
te komen: VVe noemen de identificatie en vragen dan naar de biiybe- 
horende vvaarden van andere eigenschaptypen, of - in antvvoord op 
een vraag - vve identificeren de entiteit en noemen de biibehorende 
vvaarden van andere eigenschaptypen. Voor de identificatie is het 
voldoende om een combinatie van eigenschappen te kiezen, die een 
entiteit binnen de omgeving, die ons interesseert, eenduidig 
bepaalt. 

Biğyv.: Landeliik gezien zullen "aam-adres-vvoonplaats" en misschien 
"geboortedatum" nodig ziin om eenduidigheid te bereiken. Binnen 
ö6n afdeling in een bedriif echter kan de "naam" alleen al voldoende 
zin. 
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Binnen een bedriff kan "salarisnummer" voldoende ziyln, tervvi/l bin- 
nen een gemeente het salarisnummer in het geheel niet relevant is 

en dus onbekend. Dit voorbeeld geeft aan dat zelfs "sleuteleigenschap- 
pen" binnen een omgeving binnen een andere omgeving onbelangriik, 
niet bruikbaar of onbekend kunnen ziin. 

Resumerend: mformatie is de vastlegging of communicatie van een 
selectie van eigenschappen van een entiteit. Deze selectie vvordt 
bepaald door de omgeving vvaarin de eigenschappen betekenis hebben, 
hetzi) voor identificering van de entiteit, hetzi) voor informatie- 
uitvvisseling over de entiteit, hetzi) voor beiden. 


Tussen entiteiten kunnen relatie s onderkend vvorden., 
Bifv. 

- een medeveerker be hoort tot een afdeling 

- een artikel ligt opgeslagen in een magaziin 

- een klant bestelt een artikel 


Dergeliike relaties tussen entiteiten kunnen zelf ook als een entiteit 
onderkend vvorden, vooral als aan de relatie relevante eigenschappen 
toegekend vvorden. Voorbeeld: 


een klant plaatst een order voor een artikel 


klant --- order --- artikel 

- adres - aantal - pri/s 

- korting - leverdatum - voorraad 
- leverpri/s 


het bestelde aantal, de leverdatum en de (uiteindeliike) 
leverpriis ziin duideliike eigenschappen van de relatie 
"order" tussen "klant" en "artikel". 


Relaties kunnen bestaan tussen: 
- 6en verschiiningsvorm van een entiteittype en 6en verschiinings- 
vorm van een ander entiteittype: 


( op 1) 


biyiv. een persoon is geboren in een geboorteplaats. 


Bi) iedere verschiiningsvorm van de ene entiteit behoort altiid 
een verschiiningsvorm van de andere entiteit - bi) iedere A hoort 
een B: 


s 


- 6ön verschiiningsvorm van een entiteitsoort en 0, 6en of meer 
verschiiningsvormen van een andere entiteit: 
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biyfv. een afdeling bestalat uit 0, 1 of meer medeveerkers. 


Bi) iedere verschiiningsvorm van de ene entiteitsoort behoort een 
aantal (0, 1, ...) verschiiningsvormen van de andere entiteitsoort, 
bii iedere verschiyningsvorm van de andere entiteitsoort hoort 
echter slechts öen verschiiningsvorm van de ene entiteitsoort - 

bi) een A hoort 0, 1, 2, ... Bs, bi/ iedere B behoort slechts 6€n A, 


.. 


- diverse verschiiningsvormen van de ene en de andere entiteitsoort: 


n op m) 


biiv. een magaziin bevat diverse artikelen, maar een artikel kan 
in meer dan een magaziy)n vvorden opgeslagen. 


- 


Bi) een verschiiningsvorm van een entiteitsoort kunnen 0, 1 of 
meer verschiiningsvormen van de andere entiteitsoort behoren en 


omgekeerd: 


De database conceptie volgens de CODASYL voorstellen vereist 
echter dat deze laatste relatiesoort niet rechtstreeks in een database 
gehanteerd vvordt. Derhalve dient deze vorm "vertaald" te vvorden. 
Dit kan biyvoorbeeld door de relatie als zodanig als een entiteit te 
onderkennen (in de praktiğk is dit veelal toch al nodig, omdat eigen- 
schappen van de relatie vastgelegd moeten vvorden). Vervolgens 
vvorden relaties onderkend tussen de "relatie entiteit" en de beide 
oorspronkeliike entiteiten. 

Biyv.: 


relatie type relatie verschiininxsvorm 


00-ə 
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vvordt vastgelegd als: 


relatie type relatie verschiiningsvorm 


Vaak is er geen duideliik onderscheid tussen een eigenschap van een 
entiteit en de relatie met een andere entiteit. 

Voorbeeld: 

Een medevveerker voont in een voonplaats. 

Eigenliik is hier sprake van een relatie tussen medeverker en 
voonplaats. In de praktiyk vvordt deze relatie echter vaak als 
een eigenschap "vvoonplaats" van de medevverker gehanteerd. 


Het omgekeerde is ook mogeliik. Dit komt vooral voor, indien de 
eigenschap van een entiteit meer dan 6€€en vvaarde tegeliik kan hebben 
voor €öen verschiiningsvorm van de entiteit. 

Voorbeeld: 

Het golfbereik van een radio. Een radio kan meer dan E€k€n golf- 
bereik hebben. Dit is in eerste instantie een eigenschap. Men kan 
hem echter ook opvatten als een relatie tussen €ken radio en 6en of 
meer golfbereiken. 


8.2,2 Records en data-items 


VVanneer vi) de CODASYI voorstellen volgen, dan is de kleinste 
gedefinieerde informatie-eenheid in een database de data-item. 
Een dergeliik data-item kan dan vvelisvvaar opgebouvvd ziin uit cen 
of meer karakters, maar deze karakters afzonderliik representeren 
geen informatie in de database. Bifv.: 

de naam van de medeverker: 2ANSEN. 

De afzonderliğke letters 2, A, N, S, E en N echter vertellen ons 
niets van de entiteit medeverker 4ansen. 
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m een database is dus de data-item het kleinste ondeelbare ele- 
ment: de elementaire informatie-eenheid. 


Eigenschappen van entiteiten en relaties vvorden in de database 
va.stgelegd met behulp van data-items. 

De vaarde van de eigenschap vordt dan gerepresenteerd door de 
inhoud van het data-item. 


mn de CODASYL concepties vvordt een record gedefinieerd als een 
benoemde verzameling van nul, 6en of meer data-items. Het ligt dus 
voor de hand het record te associ6ren met een entiteit vvaarvan de 
eigenschappen dan vastgelegd vvorden in de data-items van het record. 
Meervoudige eigensechappen kunnen dan vastgelegd vvorden met behulp 
van vectoren en repeterende groepen. 

Een vector is in dit verband gedefinieerd als een €€ndimensionale 
geordende verzameling van verschiiningsvormen van een elementair 
data-item in een record. 

Een repeterende groep is een geordende verzameling van 
verschiiningsvormen van een groep data-items, vectoren of repe-. 
terende groepen in een record. 

Vectoren en repeterende groepen ziin speciale vormen van een 
groepering van data-items. m CODASYL concepties vvordt in het 
algemeen een groep data-items aangeduid door het begrip data- 
aggregatie (data-aggregate). 


Uit het oogpunt van flexibiliteit en efficieney verdient het echter aan- 
beveling in de meeste gevallen om meervoudige eigenschappen vast 
te leggen als (1 : n) relaties, vooral indien de n niet voor alle ver- 
schiiningsvormen van een entiteittype dezelfde vvaarde heeft. 


Voorbeelden: 


1. record met elementaire data-items. 


medevverker: 


V/oonplaats 


QANSEN HOFVELD ARNHEM 
SMIT KERKALLEE 3 


2. record met vector. 


radio: 
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3. record met repeterende group. 


gezinshoofd: 


yas 
KLAASSEN İ 9AN İ 5-3-56 13-12-60 


8.2.3 CODASYL sets 


Volgens de CODASYIL voorstellen kunnen (1 : n) relaties rechtstreeks 
vastgelegd vvorden in een database. Voorvvaarde is echter, dat deze 
relaties bestaan tussen verschillende entiteittypen. Hiertoe heeft 
CODASYI een begrip "set" gedefinieerd: 


- Een SET (type) is een benoemde verzameling van recordtypen, 
vvaartussen een relatie bestaat. Hierbi) vormt een recordtype het 
OVVNER type, een of meer andere recordtypen MEMBER 
typen. 


- Een SET verschiiningsvorm vvordt gevormd door ö6ön verschi/- 
ningsvorm van het OV/NER recordtype en 0, 1 of meer ver- 
schiiningsvormen van de MEMBER recordtypen. 


- Een recordtype kan niet tegeliik OVVNER type en MEMBER type 
in 6en en hetzelfde settype ziln. 


- Een recordtype kan OVVNER type ziifn in 0, 1 of meer settypen en 
tegeli)ikertiyfd MEMBER type in Ü, 1 of meer andere settypen. 


- Een record verschiiningsvorm van het OVVNER recordtype impli- 
ceert een verschiiningsvorm van het settype vvaarvan het OV/NER 
is. 


- Een verschiiningsvorm van een MEMBER recordtype participeert 
slechts dan in een set verschiiningsvorm, vvanneer daadvverkeliyk 
een relatie gelegd is tussen de record verschiiningsvorm en de 
set verschiiningsvorm. Deze relatie kan in het algemeen ook vveer 
verbroken vvorden, zonder dat de record verschiiningsvorm uit 
de database vervvifderd vvordt. 


- Een verschiiningsvorm van een MEMBEHR recordtype kan slechts 
in 6en verschiiningsvorm tegeliikertiid van een settype voorkomen. 


Een dergeliik settype kan in diagram als volgt vveergegeven vvorden: 


Afdeling 


- personeel 


bifv. 


TMember 
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Een set bestaat dus uit een OVVNER, een MEMBER, en de relatie 
ertussen. De piğlpunt indiceert, vvelk recordtype het MEMBER type 
is. Een dergeliik diagram vvordt vvel BACHMAN-diagram genoemd, 
naar Charles Bachman die deze vviyze van set vveergave het eerste 
gebruikte., 


Uit de definities blifikt dat een set relatie conceptueel ook meer dan 
een MEMBER type mag bevatten. 
Bifv.: 


artikelgegevens 


Algemene İ İPrifs- Rabat- 
gegevens gegevens condities 
De meeste implementaties beperken zich echter tot 66n member- 
type per settype. Dit temeer aangezien het vveinig voorkomt, dat 


6en logische relatie bestaat tussen 6€en entiteit en meer dan 66n 
andere entiteit. 


Bovenstaand voorbeeld kan dan ook zeer goed vastgelegd vvorden als: 


Artikel 


rabatten 


artikelgegevens 
priizen 


Algemene Priis- Rabat- 
gegevens gegevens İ İl gegevens 


Bovenstaand set-begrip vvifkt enigszins af van het algemene begrip 
uit de vviskunde, etc. 

Derhalve vvordt (buiten CODASYL geöriönteerde omgevingen) dikvviyls 
de term CODASYL-set of coset gebruikt om dit settype aan 

te duiden. 

De Bachman-notatie vvordt gebruikt om settypen en structuren 
van settypen aan te geven. 


Om een set verschiiningsvorm ult te beelden, vvordt de vol- 
gende notatie toegepast: 


"nember (1) 


“.m— 


“ember (3) 
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Voorbeeld: 


AFDELING 


PERSONEEL 


MEDEVERKER 


“PPieters 


8.2.4 Logische database structuren 


Het geheel van gegevenseenheden (records) en de relaties ertussen, 
vvordt de gegevensstructuur (info-structuur, data-structuur) genoemd. 
Dergeliike structuren kunnen met behulp van het set-concept vastge- 
legd vvorden. Hierbi) moet echter vvel gelet vvorden op het onder- 
scheid tussen een structuur van settypen en een structuur van de 
set-verschiihningsvormen. Het samenstel van settypen structuren 
vormt dan de structuur - voorschrift van de database - het schema. 
De set-verschiiningsvormen leggen dan de structuur van de infor- 
matie vast volgens de regels van het schema. 


m de database structuur (schema) kennen vi) drie structuur grond- 
vormehn: 


1. Sequenti6le structuur 
De set grondvorm is een voorbeeld van een sequentieel settype 


structuur. 
Het kenmerk is dat de recordtypen 
ovrner ziin in ten hoogste ö6ön set- 
type en eveneens memhber in 6en 
SI (ander) settype. 
x De uitgebreider vorm is dan ook: 
. Recordtype Ovyner Member 
S1 A S1 - 
.. B 52 Sl 
C - 52 


S2 
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2. Boomstructuur 
Het kenmerk van de boomstructuur is, dat een recordtype ovmer 
kan ziin van meer dan öön settype maar alleen member kan ziin 
in c6en settype. 


Grondvorm: 


Recordtype Ovyner Member 
Sl S2 A S1, 82 - 
B - SI 
kü 7 . ı 


Een uitgebreider voorbeeld is het volgende. Hierbi) bliikt, ener- 
zi)ds dat de sequenti6öle vorm als een speciale vorm van de boom- 
structuur beschouvvd kan vvorden. 

Anderziiğds bliikt, dat een structuur een boomstructuur genoemd 
vvordt, indien de structuur tenminste 66n boomgrondvorm bevat, 
en verder alleen boom- en sequenti6le grondvormen, 


Recordtype Ovner Member 
A S1, $2 - 
öı öz B S3 SI 
İB Ç S6, S8, $9 52 
D S4., S5 S3 
E - S4 
3 S6 9 F A S5 
G S7 S6 
RAR SS z : s7 
SA S5 S7 ? ğ z 


Elli. 


ə, Netverkstructuur 
Het kenmerk van de netveerkstructuur is, dat een recordtype 
member kan ziifn in meer dan öön settype. 
Daarnaast kan het echter ook ovmer ziin in meer dan 66n settype. 
De boomstructuur en de sequenti6le structuur ziğn dan ook als 
speciale gevallen van de netvverkstructuur te beschouvveen. 
De grondvorm van een netveerkstructuur is dus: 


.. Recordtype Ovner Member 
SI 2 A SI - 


B S2 - 
—.. sı, 52 
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Als in een uitgebreider structuur tenminste ö6n keer de netveerk 
grondvorm voorkomt, dan noemt men de gehele structuur een 
netvverk, 


Recordtype Ovner Member 


A SI, S2 .. 
B s3 Si 
C S5 S2 
D S4 S3 
E S6 S4, S5 
F ? S6 


Structuren kunnen een eyclisch karakter bezitten, d. vv. z. in een 
dergeliike structuur kunnen öön of meer eycli voorkomen, Een eyclus 
bestaat uit een gesloten sequentie van settypen, zodanig dat de 
MEMBER van de Haatste" set de OVVNER is van de "eerste" set, 


Recordtype Ovner SMember 


A S1, S2 - 
B Sə S1 
C 4. .. 
D S5 S2, S7 
E S6 S4., S5 
3 S7,S8 S6 
G - S8 
Cyclus 
Recordtype Ovner Member 
D s5 “87 
E S6 Sb 
F 01-ə 89 
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m de CODASYI concepties ziyin deze eyclische constructies volledig 
toelaatbaar en ververkbaar. 


De structuur van een set-verschiiningsvorm is in principe altiid een 
boomstructuur. De set relatie is immers1:0n. 

Per set verschiiningsvorm heeft 6en ovner een relatie met meer dan 
een memhber, 


—.....— 
—— 


maar ieder memhber heeft slechts relatie met 6öen ovner. 

De CODASYI voorstellen staan toe, dat tussen de members onder- 
ling een volgorde relatie onderkend kan vvorden: memhber 1 vordt 
altifd direct gevolgd door member 2, etc. CODASYI definieert hier- 
bi) zelfs dat member 1 de ovmner volgt, tervviil het laatste member 
aan de ovner voorafgaat. 

m diagram kan dat als volgt vveergegeven vvorden: 


—— “” “” .. 
Als volgorde ecriteria kunnen verschillende mogeliikheden gebruikt 
vvorden: 

- op opklimmende vvaarde(n) van eön of meer data-items, bifiv. alfa- 
betiseh op naam, 

- op positioneringsvolgorde, biiv. altifd achteraan of vooraan nieuvve 

members toevoegen. 


Het volgorde criterium is per settype , dus geldt voor alle ver- 
schiiningsvormen van een settype. 

mdien de volgorde is op opklimmende of afdalende volgorde van 6en 
of meer data-items, dan vormen deze items a. h. vv. een opklimmende 
of afdalende sleutel. 


CODASYI onderseheidt verschillende relatievormen, gerekend naar 
de vviize hoe de relatie tussen een member en een set-verschiynings- 
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vorm tot stand komt. Enerziğids beschouvt men hier het leggen van 
de relatie, anderziğ)ds de verbreking: 


- De relatie tussen een memhber en een set verschiiningsvorm kan 
automatisch gelegd vorden door het DBMS op het moment, dat 
het memhber als record in de database vvordt gebracht (AUTOMATIC 
MEMBERSHTP). 

Het alternatief is, dat de gebruiker altiid zelf "met de hand" 
de relatie laat aanbrengen tussen een reeds aanvvezig record en 
een set verschiihingsvorm (MANUAL MEMBERSHTP). 


- De relatie kan per definitie van bliyvende aard ziin. D.vv.z. de 
relatie, eenmaal tot stand gebracht, kan slechts verbroken vvorden 
door het memhber uit de database te vervviyderen: Een eenmaal 
gelegde relatie is verplicht (MANDATORY MEMBERSHTP), 
Hier is de tegenstelling, dat een relatie naar eigen keuze 
vveer verbroken kan vvorden (OPTIONAL MEMBERSHIP). 


De combinatie van MANDATORY en AUTOMAT IC levert de mogeliik- 
heid, dat een record verschiiningsvorm per definitie member moet 
ziln in een set verschiiningsvorm. Dit vvordt dan op schema niveau 
vastgelegd. Vervolgens zal het DBMS er op toezien dat de relaties 
bi) inbreng van een record in de database vvorden vastgelegd en 
hierna niet meer vvorden verbroken. Andere combinaties houden 
altiid in, dat de gebruiker procedureel de relaties moet leggen en,/ of 
verbreken. Hi/ is daar dan ook verantvvoordeliik voor de relaties. 


8.2.5 Areas 


De records en sets, die de informatie vastleggen, vvorden in de data- 
base ondergebracht. Hoevvel de fysieke vviize van opslag voor het 
logiseh gebruik niet relevant is, zal toch een zekere controle op de 
opslag op logisch niveau nodig ziin. Indien biifvoorbeeld een database 
zo groot is, dat deze niet in ziin geheel actief op de computer aan- 
vvezig kan ziin, dan is het noodzakelifk, dat de database logisch in 
delen onderverdeeld kan vvorden. Een of meer delen kunnen dan 
tegelifik actief of non-actief ziin. 

Men moet dan echter kunnen aangeven, vvelke informatie in vvelk 
database deel bii) elkaar opgeslagen moet vvorden. 

Merk op, dat hierbi/i niet belangriyk is, hoe het opgeslagen vvordt. 


Een variant hierop is het archiveren van "verouderde" informatie. 
Een apart deel van de database vvordt dan bestemd om archiefinfor- 
matie te bevatten. Dit gedeelte dient alleen actief te ziin (on-line) 
als de archiefinformatie nodig is, c.q. indien informatie naar het 
archief dient te verhuizen. 
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Een andere mogeliykheid is, dat men tiğdens de informatieverveerking 
behoefte heeft aan een tiideliik "klad" deel in de database om hierin 
informatie tiideliik op te slaan. De in dit deel aanvvezige informatie 
is dan niet relevant meer zodra het verveerkingsproces be6indigd is, 


De mogeliykheid voor deze semi-fy sieke opdeling van een database 
is in de CODASYL-voorstellen, het AREA concept. Hierin veordt de 
database gezien als een adresseerbare ruimte, onderverdeeld in 
partities - de AREAS, Ieder record verschiiningsvorm vvordt in de 
database opgeslagen op een uniek adres in deze ruimte. 

Het geschikte adres vvordt gevonden in de AREA, vvelke ten tiide van 
inbreng van de informatie in de database vrordt bepaald. 


Een biikomend gebruik van het area concept volgens CODASYI is 
om hiermee toegangsmogeliikheden tot brokken informatie te auto- 
riseren en controleren. 

Men dient per area een mogeliike toegang tot de hierin aanvvezige 
informatie van te voren kenbaar te maken. Voor autorisatie kan 
hieraan een privacy-mechanisme verbonden vvorden, zodat men het 
yYuiste vvachtvvoord moet meegeven, Voor de controle op geliykti)dig 
gebruik van de database door meer dan een gebruiker, kan men 
delen van de informatie, ondergebracht in 6en en dezelfde area ook 
per area tiğdeliğik exclusief reserveren (exclusive access) of be- 
schermen tegen geliyktiğidige verandering door anderen (protected 
access), 


8.2.6 Sechema DDL 


De beschriiving van de recordtypen en settypen, vvaarin de informa- 
tiestructuur vastgelegd vvordt in voor een database management 

sy steem bruikbare termen, vvordt het SCHEM5A van een database 
genoemd. Hierin ligt dan de logische opbouv van de database 
vast, De gebruikte taal is de SCHEMA Data Definition Language 
(DDL). 

De beschriiving van de database structuur - het SCHEMA - vordt 
onderverdeeld in vier groepen: 


1, SCHEMA-ENTRY 
Hierin vvordt de naam van de database gedefinieerd. Ook kunnen 
hier autorisatie controles - PRİVACY LOCKS - op het niveau van 
de gehele database en het Sehema hiervoor vastgesteld vvorden, 


2, AREA-ENTRIES 
m deze sectie vvordt de opdeling van de database in areas vast- 
gelegd, Ook hier kunnen de autorisatie controles per area gede- 
finieerd vvorden., 
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a, RECORD-ENTRIES 
Vervolgens vvorden de recordtypen gedefinieerd. Per record 
vvorden hier de record karakteristieken vastgelegd en tevens uit 
vvelke data-items het recordtype bestaat. 
Autorisatie controles per recordtype kunnen hier gedefinieerd 
vvorden. 


4. SET-ENTRIES 
De laatste groep bevat de definities voor de settypen en met vvelke 
recordtypen als OVVNERS en MEMBERS zif de relaties vormen. 
Autorisatie controles op set niveau kunnen ook vastgesteld vvorden. 


m de record-entries en set-entries kunnen per recordtype of settype 
sleutels (search keys) gedefinieerd vvorden. De records kunnen met 
behulp hiervan sneller geidentificeerd vvorden. 

Zie ook paragraaf 8,5 - Database manipulatie. 


8.3 Fysteke opslag van databases 
8.3.1 Opslag onafhankeliikheid 


Een van de belangriilke eigenschappen van een goed database manage- 

ment systeem is, dat de İysieke opslag van de data gescheiden vvordt 

van de logische representatie. Hiermee vvordt bereikt dat de gebrui- 

ker zich niet hoeft te verdiepen in de vviize van fysieke opslag, 

noch in de optimalisering hiervan, als hii de gegevens logisch ver- 

vverkt., De iysieke kenmerken mogen dan ook niet doordringen in het 

logische interface met de gebruiker. 

Dit houdt niet in, dat de gebruiker de fysieke opslag niet zou kunnen 

bepalen of beinvloeden. Natuurliik dient de fysieke opslag ook van 

buitenaf te definiören en te besturen te ziin. De daarbii betrokken 

karakteristieken en grootheden ziin onder meer: ı 

- VVİİZEe Van administratie der opgeslagen record verschiiningsvormen, 

- İysieke vastlegging der set relaties met biibehorende administratie, 

- aantallen opgeslagen of te vervvachten record verschiiningsvormen 
en set relaties, 

- de te gebruiken achtergrondgeheugens met vvelke adresserings- 
technieken, 

- lengte en blokkingsfactor van de fysieke records. 


Niet alleen de aantallen records, etc. bepalen de optimale keuze 

van deze grootheden, maar ook de te gebruiken benaderingsmethoden 
in de database en de frequenties hiervan. Ook de dynamiek van de 
informatie - de vervangingsgraad en de informatiegroei - beinvloe- 
den de optimale dimensionering van de fysieke opslag. 
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Het is heel goed mogeliiğk, dat in de loop van de tifd dat de informatie 
in de database gebruikt vvordt, bepaalde gebruikspatronen zich vvi/- 
zigen. Het is dan zeer belangriğk de fysieke opslag naar de veran- 
derde situatie te richten zonder dat dit de constructie van de ge- 
bruikersprogramma."s doet veranderen. Een gebruiker mag dit alleen 
merken, doordat gemiddeld genomen zifn database benadering snel- 
ler verloopt. 


8,3.2 Opslagstructuren 


De opslagstructuur vvordt in tvvee niveaus verdeeld: 
- de fysieke database structuur 
- de device opslag. 


Het eerste niveau is de fysieke afbeelding van de database. Hierin 
zi)n alle logische elementen terug te vinden in hun fysieke gedaante. 
De basiseenheid bli/ft het logiseche record, echter eventueel aange- 
vuld met interne database administratie, vvelke niet zichtbaar is 

voor de gebruiker. 

in een database heeft iedere logische record verschiyningsvorm alti)d 
minstens eön unieke identificatie - de database key. Deze heeft een 
door de DBMS gegenereerde unieke interne vvaarde. De gebruiker 
beschikt echter over middelen deze vvaarde als identificatie te ge- 
bruiken. 


Voor het aangeven van de relatie tussen OVVNER/"s en MEMBER":s 

in de diverse SET"s kan een aantal technieken gebruikt vvorden zoals 
kettingadressering (chaining), vervvi)sadressen (pointer array) en 
İysiek sequenti6le vervviizingen, 


Kettingadressering (chaining) 


OVVReT OCC. 5” 
menber oce. İP Torl------ 


I 
i 
l 
I 
. 
İ 
İ 
İ 
I 
İ 
b 


mentər oo əl. Torl-— 


ə və ul” li ə dadə ə xa A ə 02 əl 


Pp c POLNTER 
OP — OVNER POINTER 
OoCC, ” occurrence (verschiiningsvorm) 
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Verviisadressen (pointer array) 


ovmer oce, 1 PİPİP. 
member occ, 1 goy 


İ 

s.ə 
: member oce, 2 İT OPİ--s 
lı 
ı “member oce, 3 İ OPİ-.- 
BE. kı ə ə Q m 0 x 0 1 Xe x gl 


De vervvifsadressen vvorden in de praktiik meestal in een gesorteerde 
tabel opgeslagen, die via vervviizing met de ovner verbonden is. 
mdien de set volgorde d. m.v. een opklimmende of afdalende sleutel 
vvordt gedefinieerd, dan vvordt deze (primaire) sleutel ook in de tabel 
opgenomen. 


Fysiek sequentieel 


OVVneT OCC, memhber occ. 1 ovyner occ, 2 member occ. 3 


Een SET verschiiningsvorm vvordt in Gen of meer fysieke blokken 
opgeborgen., 

Meestal bevat ieder member verschiiningsvorm ook een terugver- 
vriizing (OP) naar de ovner vvaar het bii hoort. 

VVelke van deze technieken gekozen vvordt, hangt voor een groot 

deel af van de soort applicatie en de mogeliikheden die het "database 
management" systeem geeft, De keuze van de te gebruiken techniek 
heeft een grote invloed op de vervverkingsefficiency. 


Op set relaties kunnen ook secundaire sleutels gedefinieerd vvorden 
(search keys). Deze vvorden dan in hulptabellen vastgelegd. Fysiek 
ziin deze hulptabellen öf in sequenti6le volgorde van secundaire 
sleutels gevuld, öf d.m.v. een randomising techniek., 


Het tvveede niveau van de iysieke opslag is de vverkeliflke opslag op 
de achtergrondgeheugens. De basiseenheid hierin is het iysieke 
record of blok, De database inhoud - de gebruikersgegevens en de 
interne administratie - vvordt over de blokken gedistribueerd en zo 
op de geheugenmedia opgeslagen. m de meeste gevallen vvorden 
hiervoor magneetschiiven gebruikt. De daarbii meest gebruikte 
opslagvorm is de relatieve bestandsorganisatievorm. 
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Logische records (verschiiningsvormen) vvorden, al dan niet aange- 
vuld met interne administratieve gegevens, geblokt in fysieke blok- 
ken. Meestal bevatten de fysieke blokken een of meer gehele logische 
records. Soms echter komt ook "spanning" voor, d. vv. z. een logisch 
record vvordt vvegens ziin grootte verdeeld over tvvee of meer fysieke 
blokken. 


Adrestabellen of "randomising" technieken leggen verband tussen de 
logisehe record identificatie (sleutels, etc.) en de fysieke blokken 
vvaar de record verschiiningsvormen zi)n opgeslagen. 


De hulptabellen voor sleutels en andere interne administratie vvorden 
ook "geblokt" in de fysieke blokken opgeslagen. Indien de tabellen 
gesorteerd ziin (pointer array, indexed search key), dan vvordt vaak 
intern een indexeringstechniek op deze tabellen toegepast zodra een 
tabel over meer dan 6ö6n fysiek blok verdeeld is. Deze index op de 
index bevat dan per entry de hoogste key vvaarde, die in een bepaald 
blok voorkomt plus de vervviizing naar dat blok. Dit kan op meer 

dan öGön niveau plaatsvinden (index op de index van de index). (Zie 
fig. 28 op biz. 129.) 


8. 3,3 DDL-elementen of SSL voor opslagdefinitie 


CODASYI heeft voor de fysieke opslagstructuur definitie een aantal 

taalelementen aan de DDL toegevoegd. Deze elementen defini6ren 

0,12.: 

- een "randomising" relatie tussen een sleutel en de plaats in de 
database, 

- de implementatievorm van een set relatie in pointer array, chain, 
etc, 


Voor de defini€ring van de opslag grootheden geeft CODASYL geen 
taalelementen, doch volstaat met de suggestie, dat een DBMS 
fabrikant dit zelf doet in een DMCL (device media control language). 


De Philips en Siemens implementaties van de CODASYL voorstellen 
gaan een stap verder. Deze hebben alle fysieke defini6ringen onder- 
gebracht in een aparte taal, de Storage Structure Language SSL. 
Hieraan ziin ook kvvantificeringselementen toegevoegd. Deze defini- 
eren ook gedeelteliik de opslag grootheden. De overige opslaxg 
parameters vvorden vastgelegd d.m.v. 2CL in de creatiefase van 

de database, 
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8.4 Data betronubaarhetd en besehermiüng 


Bi) de opslag en vervverking van informatie speelt het begrip 
"betrouvvbaarheid" (reliability) een grote rol. Deze betrouvbaarheid 
kent een aantal aspecten: 


1. Geheimhouding. Zekerheden tegen ongeoorloofd gebruik der 
informatie (privacy). 


2. Veiligheid. Zekerheden tegen verloren gaan der opgeslagen 
informatie (security). 


38, Accuratesse. Zekerheden tegen oniuistheid der gegevens 
(accuracy). 


4. Integriteit., Zekerheden tegen conflicten tussen de opgeslagen 
informatie-eenheden (integrity). 


5ə, Consistentie. Zekerheden dat fuiste informatie ook iysiek 
fuist vvordt opgeslagen (consistency). 


Van deze viif punten heeft alleen het laatste punt betrekking op de 
Tuiste vverking van het gebruikte database management systeem. Dit 
kan dan ook door het DBMS zelf gecontroleerd vvorden. 

De andere vier punten hebben betrekking op het fiuiste beheer en 
gebruik van het gebruikte DBMS. Hier kan het systeem hooguit 
mogeliikheden bieden om fuist gebruik te helpen controleren door 
de beheerder of gebruiker (biiv. input-secreening, privacy checks). 


Vooral na de komst van de databases, vvaardoor een aantal gebrui- 
kers, al dan niet tegeliikertiid, vri) gemakkeliik toegang kunnen 
kriğgen tot allerlei gerelateerde informatie, is het duideliik gevvor- 
den (vaak door schade en schande) dat de betrouvibaarheidscontrole 
een primaire noodzaak is. 

Ook is aan het licht gekomen dat controle alleen niet genoeg is, 
maar dat het ook mogeliik moet ziin, om een geconstateerde fout 
snel te kunnen herstellen. 

De beschikbaarheid (availibility) van de informatie moet dus zo kort 
mogeliik onderbroken vvorden om het systeem vveer in betrouvbare 
toestand terug te brengen (recovery). 

Om dit te kunnen bereiken moeten in het systeem en de informatie 

al voorbereidende maatregelen genomen vvorden, voordat een fout 
optreedt. Deze kunnen ondermeer bestaan uit het regelmatig trekken 
van een copie van de informatie op een gedefinieerd moment dat de 
informatie nog betrouvbaar is (back-up), het administreren van de 
vViİzigingen, die plaatsvinden (logging) en het meer dan eens opnemen 
van vitale informatie (controlled redundancy). 
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8.4.1 Geheimhouding (privacy) 


Onder bescherming van gegevens, "geheimhouding", verstaan vve het 
voorkomen van ongeautoriseerde toegang tot die gegevens. Zo"n 
beseherming moeten vve kunnen bieden op verschillende niveaus. 

VVe zullen gegevens moeten kunnen beschermen tegen lezen, vviizigen 
en vervviğderen. Ook moeten vve in staat ziin te voorkomen, dat 
relaties tussen bepaalde gegevens kunnen vvorden vastgelegd of ver- 
broken. Een voorbeeld kan dit verduideliiken. 


Figuur 29 geeit de gegevensstructuur vveer van een stukie personeels- 
administratie: per medevverker ziln o.a. geregistreerd de salaris- 
gegevens en de medische gegevens. 

Het zal duideliik ziin, dat niet iedereen toegang mag hebben (inzage 
mag hebben) in de salarisgegevens van een medevveerker, mn nog 
sterkere mate geldt dit vvellicht voor ziin medische gegevens. Deze 
gegevens zullen vve dus moeten beschermen tegen lezen en vvel 
zodanig dat de salarisgegevens alleen toegankeliik vvorden gemaakt 
voor functionarissen en/ of programma.s van de salarisadministratie, 
en de medische gegevens uitsluitend en alleen voor de bedriifsarts 


en ziyn staf, 
medevverker 


medische 
gegevens 


salaris- 
gegevens 


Fig. 29 


Ten aanzien van het vviizigen van salarisgegevens zullen vvaarschiin- 
İlifk verdergaande maatregelen moeten vvorden getroffen dan voor 
lezen, tervvill een nog grotere beperking moet bestaan voor het ver- 
vriideren van de salarisgegevens. VViizigingen kunnen biivoorbeeld 
vvorden voorbehouden aan de personeelchef, 

Het kan ook voorkomen, dat t.b.v. de vaststelling van begrotingen 

of ter vville van de statistiek de salarisgegevens of de medische 
gegevens moeten kunnen vvorden gelezen, maar dan los van de per- 
sonen op vvie gegevens betrekking hebben. Dan moet dus bescherming 
vvorden geboden tegen het vinden van relaties met deze personen. 


Merk op, dat de bescherming gericht is tegen ongeoorloofde toegang 
van personen tot de gegevens. 

Biy, een persoon mag geen kennis nemen van de 
gegevens. 
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Een database handler programma zal dus vvel een LEES-opdracht 
mogen uitvoeren, als het programma de ingelezen 
informatie maar niet uitprint, de informatie mag ook niet 
zichtbaar vvorden d, m.v. een door de gebruiker opgeroepen dump 
van het computergeheugen. 

Er bestaan verschillende technieken om bescherming te realiseren. 
De vier meest voorkomende zullen vve hier kort bespreken, 


a. 


p 


Sleutels 

De geautoriseerde gebruiker (s) van bepaalde gegevens vvordt een 
sleutel (Engels: privacy key) verschaft met behulp vvaarvan het 
slot (Engels: privacey lock) dat op die gegevens is gelegd, kan 
vrorden geopend. Zoals in een niet-geautomatiseerde omgeving 
bepaalde geclassificeerde gegevens vvorden verstrekt na het tonen 
van een pasie dat slechts na "secreening" vvordt uitgegeven, zo 
zullen gegevens uit een (geautomatiseerde) gegevensverzameling 
pas vvorden verstrekt nadat een vvachtvvoord (Engels: passvvord) 

in orde is bevonden, 

Als met bestanden vvordt gevverkt, zouden dergeliike vvachtvvoorden 
in de bestandlabels kunnen ziin opgenomen. In een geintegreerde 
gegevensverzameling (database) kunnen dergeliğ)ke vvachtvvoorden 
zelfs vvorden geregistreerd op record-niveau en op veldniveau. 
De gebruiker van de gegevens moet vooraf ziin vvachtvvoorden 
opgeven als hi) bepaalde beschermde bestanden of gegevens vvil 
vervverken, 


Separatie 

Separatie (İysieke scheiding) van gegevens vvordt bevverkstelligd 
door ze op te slaan in kluizen of althans zodanig dat ze fysiek 
moeiliik bereikbaar ziin. 

Als van bestanden t. b. v. computervervverking gebruik vvordt 
gemaakt, kan deze methode biiv. vvorden gerealiseerd door lees- 
bare instructies op haspel (Engels: tape reel) of schiyvenpakket 
(Engels: disk packet) te zetten. 

De beslissing over het plaatsen van een dergeliike haspel of 
pakket op de apparatuur moet dan vvorden genomen door de 
bestandsbeheerder. 

m een database is een dergeliike bescherming mogeliik door 
vitale gegevens in aparte areas onder te brengen die alleen na 
speciale opdracht op de computer opgebracht vvorden. 


Codering 

Zoals sommige geclassificeerde informatie kan vvorden vastge- 
legd in een bepaald geheimsehrift, vvaarbi) de lezer (gebruiker) 
dan een codeersleutel nodig heeft om die informatie te ontcifferen, 
kunnen in bestanden en databases ook bepaalde gegevens in een 
gecodeerde vorm vvorden vastgelegd. De programma. s zullen 
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dan een procedure moeten defini€ren die deze code omzet in een 
bruikbare vorm. 


d. I1ncomplete beschriiving 
Door gedrukte of geschreven informatie slechts te verstrekken 
aan uitdrukkeliik belanghebbenden (biğv. met behulp van een ver- 
zendliist) kan eveneens in zekere mate bescherming vvorden ge- 
boden. m een gautomatiseerd systeem kan dit vvorden gerealiseerd 
door een recordtype in het programma zodanig te beschriiğven, 
dat alleen de relevante gegevens ziin gedefinieerd. Meestal zal 
dan vvel de lengte van de "vveggelaten" gegevens moeten vvorden 
opgegeven ("filler). 
m een database is het bovendien mogeliik om door middel van 
een subschema slechts die gegevens te vermelden, die voor een 
specifiek probleem relevant zifn. 


Belangen zullen moeten vvorden afgevvogen door een onparti)dige 
instantie, die verantvvoordeliik moet ziyn voor de uitgifte van vvacht- 
vvoorden aan de gebruikers van die bestanden. Deze instantie heeft 
dan tot taak te bemiddelen tussen de eventuele gebruikers van de 
gegevens en de naleving van de door hem uitgevaardigde voorsechrif- 
ten te controleren. 

Naarmate de bestanden meer ziin geintegreerd in alles omvattende 
gegevensverzamelingen (databases), zal deze functie belangriiker 
vvorden. Een database is immers in principe toegankeliik voor 
iedereen, 


Tenslotte zi) nog vermeld, dat bescherming van gegevens niet bete- 
kent, dat de programmeur minder zorgvuldig behoeft te ziin als hi) 
die gegevens gaat vervverken. Integendeel, hi) zal zich zeer bevvust 
moeten ziin van de consequenties van een verandering die hi) aan- 
brengt in beschermde gegevens. 

Een extreem voorbeeld, Als iemand die daartoe gerechtigd is, een 
medevverker vervvi)dert uit een gegevensverzameling met de struc- 
tuur van figuur 29, dan dient hi) er ook voor te zorgen dat de betref- 
fende salarisgegevens en medische gegevens vvorden vervvi)derd. 
Anders zou het nog kunnen voorkomen dat iemand anders alsnog de 
salarissen kan achterhalen van medevverkers die reeds ziin ver- 
trokken (aangenomen is dat met de vervvi)dering van de medevverker 
ook het slot op de informatie vervviiderd is). Overigens is ook öen 
van de taken van de informatiebeheerder de controle op het voor- 
komen van dergeliifke situaties, 


8.4.2 Vediligheid (security) 
De veiligheidsaspecten hebben betrekking op de fysieke veiligheid 


van het computersysteem en de achtergrondgeheugens vvaarop de 
informatie is opgeslagen. 
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Dit ziin dus beveiligingen tegen: 
- brand 
- diefstal 
- vernietiging 
- beschadiging 
- sabotage 
etc. 


m deze beveiliging vvordt meestal voorzien door het vaststellen van 
menseliğike procedures en gedragsregels (alleen beveiliging tegen 
brand kan min of meer automatisch geschieden). 

Goede gedragsregels en een goede controle op de naleving hiervan 
ziin dus een eerste vereiste, 


8.4.3 Accuratesse (accuracy) 


Voor een gebruiker van gegevens is het natuurliik van belang dat de 
gegevens inderdaad iuist ziin. Helaas kan een informatiesysteem 
hiervoor nooit instaan, de verantvvoordeliikheid voor de correctheid 
der gegevens is een volledige gebruikersaangelegenheid. 

VVel is het mogelifik om met behulp van het informatiesysteem de 
fTuistheid enigermate te controleren, biiv. door gebruik te maken 
van controleprogramma.s, etc. 


Biğvoorbeeld in een personeelsadministratie systeem kan de regel 
gelden, dat iemand uit een bepaalde vakgroep een salaris moet 
hebben, dat tussen zekere grenzen ligt. 

Een controleprogramma kan nagaan of aan deze eis voldaan vvordt. 
Een afvii)king duidt op een fout. Het feit echter, dat het salaris van 
een bepaalde medevverker binnen de grenzen ligt, garandeert nog 
niet, dat het vastgelegde salarisbedrag (in de data) inderdaad iuist 
is. 


8,4.4 Dtegriteit (integrity) 


Het begrip integriteit der gegevens behelst, dat de opgeslagen gege- 
vens volledig ziin en elkaar niet tegenspreken. 

Voorbeeld: in een informatiesysteem voor bank-giro verkeer geldt 
de eis, dat een giro-betaling bestaat uit een afboeking bi) de beta- 
lende rekeninghouder en een biğiboeking bii de ontvangende rekening- 
houder, Het totaal saldo van alle rekeningen bliifft hierbi) hetzelfde. 
Is aan deze eis voldaan, dan is de informatie integer - zelfs als het 
bedrag der giro-betaling on)uist zou zi/n. 

Dit laatste is een inbreuk op de accuraatheid, 

Ook hier geldt dat slechts de gebruiker (de mensen) kan bepalen of 
de gegevens aan integriteitseisen voldoen. Een systeem immers kan 
de gegevens niet begriipen. 
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Deze integriteitscontroles kunnen in applicatie routines geprogram- 
meerd vvorden: deze routines vergeliiken logische informatie met in 
de database ingebrachte controle informatie, De applicatie routines 
kunnen de tegenspraak in de informatie dus vvel ontdekken. 

De mogeliikheid bestaat om delen van het database management 
systeem te gebruiken om de integriteit te bevvaken. Zo kan een 
DBMS systeem ervoor zorgdragen, dat bi) bepaalde handelingen 
(biyv. opslag van een bepaald recordtype) applicatie gedefinieerde 
controle routines uitgevoerd vvorden, 


8.4.5 Consistentie (consistency) 


Een opslag van gegevens vvordt consistent genoemd, als deze tech- 
nisch foutloos is, 


Voorbeelden: 

- De index entries in een index-sequentieel bestand refereren naar 
de Tuiste eylinders en sporen, 

- Records in een sequentieel bestand staan inderdaad in opklimmende 
volgorde van een zoeksleutel, 

- De "forvvard-pointer" in een kettingstructuur refereert inderdaad 
aan het record, vvaarin de "backvvard-pointer" aan het record, 
vvaarin de "forvvard-pointer" stond, terug refereert. 


De bevvaking der consistentie kan geheel door het DBMS uitgevoerd 
vvorden, aangezien voor deze controle het niet nodig is, dat de 
logisehe interpretatie der gegevens vvordt begrepen. 


Een database, die niet consistent is, is per definitie ook niet als 
integer of accuraat aan te merken. Men vveet immers niet, of schiin- 
baar iuiste informatie te vertrouvven is, Evenzo is een niet integer 
database niet accuraat, ook al liikt de informatie fuist. 


accuratesse 


gebruiker 


integriteit 


applicatie programma 


consistentie 
ı DBMS 


Fig. 30 VVerkingssfeer der graden van betrouvrbaarheid., 
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8.5 Database manipulatte 
8.5.1 Subsechema concept en DDL 


Onder database manipulatie vvorden alle handelingen verstaan, die 
gegevens in een database opslaan, of gegevens uit de database op- 
zoeken en verkriigen. 

Aangezien een database dient om de gezamenliike gegevens, vvelke 
binnen een organisatie van belang ziin, samen te brengen, zal 
meestal een gebruiker niet in alle gegevens tegeliik geinteresseerd 
ziy. In het algemeen geldt, dat bi) ieder gericht gebruik van de 
database slechts een deel van de database, een subset, relevant is. 


Om nu cen dergeliğke subset te kunnen aangeven, heeft CODASYL 
het begrip subscehema. geintroduceerd: 


Een subschema benoemt in termen van areas, records, 
data items, en sets, de subset van de database vvaarop 
een gebruiker (applicatie-programma) opereert. 


Merk op, dat een subschema dus niet de records, sets, etc. defi- 
nieert, VVel kan de gebruiker in het subschema aangeven, in veelke 
vorm hiğ de record gegevens aan hem gepresenteerd vvenst. Hif kan 
dus de record-lay-out voor ziin programma aanpassen. 

Niet alleen kunnen bepaalde data-items vveggelaten vvorden, ook 
volgorde vviizigingen van de data-items ziin mogeliyk. Hierbii ver- 
andert vanzelfsprekend de record-lay-out in de database niet. 


Dit concept van een separaat schema en subschema is belangriik 

vanuit vele gezichtspunten: 

- Zoals reeds genoemd, behoeft de gebruiker (en de applicatie- 
programmeur) zich niet bezig te houden met de gecompliceerheid 
van de volledige database, maar kan hi) zich beperken tot de voor 
hem relevante gedeelten, 

- Doordat de gebruiker alleen toegang kan hebben tot de in het sub- 
schema benoemde subset van de database, vvordt de geheimhouding 
en integriteit van de rest van de database automatisch gevvaarborgd. 

- Veranderingen in de database zullen alleen dan veranderingen in 
een programma kunnen veroorzaken als de veranderingen vviizi- 
gingen in de subset tevveeg brengen. Via de subschema"s kan dan 
de koppeling met de betrokken programma."s gelegd vvorden. 


De subsechemas leggen voor de programma"s de database subset 
vast, Er is dus een nauvve relatie tussen een applicatieprogramma 
en een subschema. Merk echter op dat verschillende programma/s 
gebruik kunnen maken van hetzelfde subsehema. VVegens de nauvve 
relatie tussen programma en subschema is voor de besehriyving van 
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een subschema een taal - de subsehema DDL, gekozen, die 
qua syntax past bi) de taal vvaarin een programma geprogrammeerd 
is, de gastheer taal (host language). 

CODASYI heeft dit rceds uitgevverkt voor de gastheer taal COBOL, 
Voor andere gastheer talen (bifv. FORTRAN) is men dit aan het 
voorbereiden. 


8.5.2 Manipulatie functies 


Ook in de database kunnen de manipulatievormen ondergebracht 
vvorden in de groepen: 

- inbrengen van gegevens 

- opzoeken van gegevens 

- kennis nemen van gegevens 

- veranderen van gegevens 

- vervvi)deren van gegevens. 


Bi) al deze manipulaties vvorden de gegevens benaderd: het access, 
hetzi) om de gegevens op te zoeken en te vervverken, hetzi) om een 
plaats op te zoeken om de gegevens in onder te brengen. 


m databases moet duideliik onderscheid gemaakt vvorden tussen 
logisech access en fysiek access. 

Het İysiek access zal biina altiid bestaan uit cen direct access 
met behulp van het relatieve adres van het fysieke blok. Een logisch 
access vvordt dan herleid tot öön of meer fysieke accessen van blok- 
ken om het gezochte logische record te vinden en eventueel hiertoe 
database administratie te raadplegen. 

Het 1ogisch access is de access-vorm vvaarmee de gebruiker (de 
applicatie-programmeur) te maken heeft. Alle hierbii betrokken 
fysieke accessen en de administratie raadpleging vvorden voor hem 
door het DBMS verricht. 

De verschillende vormen van logisch access hangen samen met de 
methoden vvaarmee records in een database geidentificeerd kunnen 
vvorden. Ook hier maakt men onderscheid tussen sequentieel en 
direct access, beide vormen ziyn echter geheel logisch, d.v.z. 
hebben geen directe relatie tot de vviize vvaarop de gegevens fysiek 
opgeslagen zii)n. 


Sequenti6le access vormen 

m deze gevallen vvordt het record geselecteerd door ziin logische 
positie t.o.v. het record dat er voor geselecteerd vverd: "volgend" 
(next) of "voorgaand" (prior). 

Deze selectie vindt dus plaats in een gedefinieerde volgorde. De 
volgorde kan dan gedefinieerd ziin binnen de groep van alle records 
van een bepaald type of binnen gedefinieerde groepen (sets). 

Als speciale vormen van sequentieel access vvorden ook gerekend: 
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- selecteer de "eerste" (first) 
- selecteer de "laatste" (last) 
- selecteer de tvveede, derde, etc. van de groep. 


Directe access vormen 

Hieronder valt in de eerste plaats de selectie op (een gedeelte van 
de) inhoud (content retrieval). 

De records kunnen algemeen binnen de database gezocht vvorden, 
maar ook bestaat de mogeliikheid de zoek naar een record te beper- 
ken tot een gespecificeerde groep: het record vvordt binnen de van 
te voren geselecteerde set gezocht. Hierbii vvordt dan gebruik ge- 
maakt van de relaties die tussen records kunnen bestaan. 

VVanneer bepaalde gedeelten van een record veelvuldig gebruikt 
(zullen) vvorden als selectie kenmerk, dan kan men aan deze gedeel- 
ten een sneller vverkend access-mechanisme verbinden, men defini- 
eert deze gedeelten als sleutel in het schema. 

Het DBMS zal dan hiervoor zoekmechanismen voorbereiden en deze 
bii access gebruiken. 

Tvvee zoekmechanismen zi)n fundamenteel mogelii)k: 

- selectie met behulp van tabellen, 

- selectie met behulp van plaatsberekening. 

Beide mechanieken leggen de relatie tussen de sleutelvvaarde en de 
plaats van het record in de database. Merk op dat deze sleuteltech- 
niek de "selectie op inhoud" niet vervangt, doch aanvult. 

Ook kan het record gedefinieerd vvorden met behulp van een intern 
volgnummer, vvaarmee het database management systeem iedere 
record verschiiingsvorm uniek kenmerkt (database key). 


Bovenstaande vormen van identificatie vvorden toegepast, vvanneer 
een record aan de database vvordt toegevoegd of vvanneer een relatie 
gelegd vvordt tussen een reeds in de database aanvvezig record en 
een set. Vanzelfsprekend vvorden ze ook gebruikt bi/ het terugvinden 
van een record in de database. 

Andere manipulaties op records, zoals vervangen, vervviideren, 
opereren altiid op het record, dat als laatste door de gebruiker 
gehanteerd is. Dit record vvordt dan het "huidige" (current) record 
genoemd. Het DBMS administreert voor iedere gebruiker vvelk 
record ziin "huidige" record is. 


8.5.3 Gemeenschappeliik gebruik 


Een van de kenmerken van een database is, dat verschillende ge- 
bruikers op hetzelfde moment toegang kunnen hebben tot de database 
(concurrent use). Het is dan ook de taak van een DBMS om te zorgen 
dat deze gebruikers zo vveinig mogeliyk hinder van elkaar ondervinden. 
Dit is vri) eenvoudig indien de gebruikers niet dezelfde informatie 
nodig hebben, of als zi) de informatie alleen raadplegen. 
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Indien echter een gebruiker de informatie verandert, dan kunnen 
conflicten ontstaan. 


Een CODASYL DBMS is er verantvoordeliik voor dat de consistentie 
van een database intact blifft gedurende een database access. Hierbi) 
is een database access gedefinieerd als 6en manipulatie (raadpleging, 
toevoeging, vervanging, vervviidering, etc.). 

Voor een afgeronde verandering van informatie in een database kan 
echter meer dan 6ön manipulatie nodig ziin, Neem het in 8.4 reeds 
gebruikte voorbeeld van een giro-overboeking. De gehele afgeronde 
transactie bestaat uit: 


1, check het saldo van de betalende rekeninghouder, 

2. ga na of de geadresseerde een rekening heeft, 

3, boek het te betalen bedrag af van de rekening van de betalende 
rekeninghouder, 

4. boek het te betalen bedrag bii op de rekening van de geadresseerde 
rekeninghouder, 


Tedere stap houdt tenminste öön database manipulatie in. Gaat men 
nu uit van een integere database, dan zal aan het eind der transactie 
de database vveer integer dienen te ziin. Tussen stap 3 en 4 echter 
is de database niet integer. 

mdien de som der rekening saldi op dat moment veordt bepaald, dan 
zal immers het over te maken bedrag een tekort opleveren. 


ATleen de gegevens die in de transactie een rol spelen bepalen de 
integriteit van de database - althans voor zover het deze transactie 
betreft. De overige gegevens ziin per definitie integer te beschouvven, 
omdat zii niet aan de mutatie deelnemen. 

VVanneer nu de te muteren gegevens onbereikbaar gehouden vvorden 
voor andere gebruikers vanaf het begin der mutatie totdat de trans- 
actie gereed is, dan zal een andere gebruiker alleen integere infor- 
matie in de database kunnen aantreffen. Tracht een andere gebrui- 
ker gedurende de transactie de te muteren gegevens te benaderen, 
dan dient het DBMS hem te laten vachtehn totdat de transactie 
gereed is, 

Dit concept houdt dus in dat een transactie de database van een 
integere staat naar een volgende integere staat brengt. Hierbi) geeft 
de gebruiker (het programma) aan vvaar de transactie begint en 
eindigt, Dit brengt met zich mee, dat, indien gedurende de trans- 
actie geconstateerd vvordt dat een volgende integere staat niet be- 
reikt kan vvorden, de transactie ongedaan moet vvorden gemaakt. 

D, vv. z. dat alle door de transactie reeds gemuteerde gegevens vveer 
hun oorspronkeliğike vvaarde moeten kriigen. 
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integere staat i 


Eeduqapısə integere staati-c1 
niet gedaz 
Fig. 31 VVerkingssfeer van een transactie. 


Het begrip transactie is hier gedefinieerd als: 

- de handelingen vvelke de informatie van een integere staat naar 
een volgende integere staat muteren, öf - bi) onmogeliikheid deze 
te bereiken - de reeds gemuteerde informatie vveer terugbrengt 
in de integere begintoestand. 


De gebruiker kan dus tiidens een gebruik van de database 6Gön of 
meer afgeronde transacties verrichten. Daarom vvordt voor dit 
transactie begrip ook vvel de term "integriteitseenheid" 
gehanteerd. Het vvoord transactie vvordt dan geassocieerd met 
het aantal samenhangende integriteitseenheden. 


Voorbeeld: 

Bi) de ordervervverking bestaat 6en bestelling uit een aantal posten: 
eön post per artikel, De registratie van de verkoop van öEön artikel, 
öön post, kan dan een integriteitseenheid vormen. De vervveerking 
van de gehele bestelling is dan een transactie. Deze aanpak houdt in, 
dat per post besloten kan vvorden of het artikel geleverd vvordt. 
VVordt per volledige bestelling beslist of deze uitgeleverd vvordt, dan 
maakt men van de gehele bestelling 6ön integriteitseenheid. 


Deze aanpak maakt het mogelifğk dat iedere transactie voor voltooiing 
ongedaan gemaakt kan vvorden zonder andere gebruikers nadelig te 
beinvloeden. Is de transactie echter gereed en dus de veranderende 
informatie voor gebruik vriigegeven, dan kan de verandering alleen 
ongedaan gemaakt vvorden door cen echte tegentransactie. Hierbi) 
moeten eventueel andere gebruikers vvel vervvittigd vvorden. 
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Ook indien een niet voltooide transactie door storingen in het systeem 
niet tot een goed einde kan komen, dan kan hi) zonder meer ongedaan 
gemaakt vvorden. 

Dit geldt dus ook voor alle transacties op een bepaald moment: 
automatiseh herstel (automatic recovery) levert dus geen afstem- 
mingsprobleem op, omdat niemand gebruik gemaakt kan hebben van 
informatie die door een ander in een niet-voltooide transactie ge- 
muteerd is (zie ook par. 8, 5.6). 


gebruiker 1 
gebruiker 2 


gebruiker 3 


toestand na herstel storing 


Fig. 32 Automatisch herstel bi) systeemstoring. 


Voor deze vverkvviize dient een te gebruiken DBMS een aantal voor- 
zieningen te bieden, 


1. Functies om begin en eind van een transactie aan te geven. 


2. Gemuteerde gegevens automatisch onbereikbaar maken voor 
andere gebruikers, totdat de transactie be6indigd is, 


3. Functies om informatie vöör verandering expliciet onbereikbaar 
te maken voor andere gebruikers, totdat deze vveer vriigegeven 
vvordt of de transactie is be6indigd. 


4. Een registratie faciliteit İlogging) van de informatie voordat deze 
gemuteerd vvordt ("before image" - nodig om de oorspronkeliyike 
staat te kunnen herstellen). (Zie ook 8, 6.4.) 


Gegevens onbereikbaar maken voor anderen, zolang men bezig is 
met gegevens, is dus een noodzaak om anderen te vriyvaren van 
"misinformatie". De ander dient dan te vvachten totdat men klaar is. 
Deze methode biedt echter een kans op vederziidse uitslui- 
ting of dodelifike omarming (deadlock). Dit houdt in, dat 
biyv. gebruiker 1 moet vvachten op gegevens vvaarmee gebruiker 2 
bezig is, maar zelf gebruiker 2 laat vvachten op andere gegevens, 
vvraarmee hi) zelf bezig is. 


Bii een dergeliy)ke dodelifke omarming kunnen ook veel meer dan 
tvvee gebruikers betrokken ziin. Een goed DBMS moet een dergeliyke 
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Gebruiker 1 Gebruiker 2 
Beginitransactie Beginİitransactie 


Muteert gegevens A 
” 


4 - ə Muteert gegevens B 
əə 
VVenst gegevens B € 7 ... 
(vvacht dus op vz 
gebruiker 2) ə 
i 


i VVenst gegevens A 

(m oet dus op 
gebruiker 1 vvachten) 
I ( 
, 


İ 
İ 
(einde transactie) (einde transactie) 
tiğd 
Fig. 33 Dodeliike omarming. 


situatie kunnen detecteren of voorkomen. m geval van detectie moet 

de transactie van een der gebruikers (biiv. degene die als laatste de 
kring sluit) ongedaan gemaakt vvorden. Dan kunnen de andere gebrui- 
kers voortgaan en de gebruiker, die onderbroken is, kan ziyn trans- 

actie opnieuvv beginnen. 


Een eenvoudiger mechaniek om te voorkomen dat gebruikers elkaar 
ongevvild "misinformatie" kunnen doorgeven, is een gedeelte van de 
database onbereikbaar te maken voor andere gebruikers, zolang 
men bezig is. Hierbi) maakt men dus ook informatie, die men niet 
zelf nodig heeft, tiydelifk onbereikbaar. 

De methode bestaat uit het exclusief toegang vragen tot een of 
meer areas van de database, 

Een tussenvorm is, vvel gebruikers tegeliik toe te laten, mits zi) 
niet de informatie vvensen te muteren, 

Deze toegangsvorm vvordt door CODASYL "beschermd" (protected) 
genoemd. 


8.5.4 D.M.L. 


Het manipuleren van gegevens in een applicatie-programma vvordt 
eveneens door middel van eenvoudige "statements" beschreven, de 
zgn. Data Manipulation Language (DML). 

De DML "statements" ziin symbolische, logische begrippen die alleen 
refereren naar de data-structuur. De opslagstructuur is hierbii) niet 
van belang. 
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De beschriiving van gegevens in een bepaalde data- en opslagstruc- 
tuur via DDL en de manipulatie van deze gegevens via DML, ziin 
tvvee volkomen gescheiden methoden, vvaarmee men bereiken vil 
dat de applicatie volkomen input/ output onafhankeliiğk vvordt. 


DML is geen taal in zichzelf, maar maakt gebruik van een gastheer 
(host) taal en past in het raamvverk van die taal, Alle verzoeken om 
gegevens ter beschikking te kriigen, toe te voegen, te vervvi)deren, 
etc. vvorden in DML statements geschreven, die als tussenschakel 
(interface) dienen tussen het programma en het DBMS, die de ver- 
keliğke 1/O opdrachten uitvoert. 

m het bronprogramma (source program) vinden vve een mixture van 
"host" statements en DML statements, men kan dus stellen dat de 
programmeur slechts eön taal hanteert. 


CODASYIL heeft voor de Data Manipulation Languages öön taal 
voorstel reeds uitgevverkt. Dit voorstel is voor de gastheer taal 
(host language) COBOL, 

Het oorspronkeliike voorstel dateert van 1971. m 19765 is een gevvi/l- 
zigd voorstel hiervoor gepubliceerd, vvelke ook ter standaardisering 
in ANS-COBOL is voorgedragen., 

Fundamenteel verschillen de voorstellen niet zoveel, hoevvel de for- 
maten soms nogal afvviiken. 


De belangriikste functies in de voorstellen ziln: 


CODASYL CODASYL 
71 75 

OPEN READY : vraagt toegang tot het deel van de 
database vvaarin informatie gemani- 
puleerd moet vvorden, 
definieert het begin van een trans- 
actie. 

CLOSE FINISH : be6indigt de verkregen toegang en de 
transactie, 

FIND FIND : geeft een opdracht aan het DBMS om 
een record verschiiningsvorm te 
selecteren. 

GET GET : stelt de inhoud van een record ver- 
schiiningsvorm beschikbaar aan het 
programma. 

MODIFY MODIFY : het veranderen van gegevens in een 
van te voren geselecteerd record. 

STORE STORE : het inbrengen van een record in de 


database. 
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DELETE ERASE : het vervviideren van een record uit 
de database, 
INSERT CONNECT : het inbrengen van een van te voren 
geselecteerd record in een set relatie. 
REMOVE DISCONNECT : het vervviideren van een van te voren 
geselecteerd record uit een set relatie, 
MOVE ACCEPT : het verkriigen van vvaarden uit spe- 


cifieke DBMS velden. 
8.5.5 Database Handler principes 
Bi) een database vvorden de standaard benaderingsfuncties voor de 
applicatie-processen verzorgd door een database handler 
(DBH). Dit is een van de belangriylkste progxramma-componenten van 
een DBMS., Het regelt alle verkeer naar en van de database, 
Onderstaande figuur geeft een indicatie hoe een DBH samenvverkt 


met de applicatie-programma./s, het operating system, etc. 
De genummerde pi/len geven aan hoe een aanvraag van programma 1 


behandeld vvordt. 
: Subschema 1 
2 


Database 
handler 


Ə 9) 


ıı, Operating system 
.-....—090 


bə 


Fig, 34 Schema van een database benadering. 


— 
s. 
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Het programma 1 plaatst een aanvraag bi) de Data Base Handler 
(DBH). Alle aanvragen vvorden in DML statements gedaan. 


. De DBH analyseert de aanvraag en vult de aanvraag aan met in- 


formatie uit het sechema en subschema voor het betreffende pro- 
gramma. Het sechema en subschema ziin oorspronkeliik in DDL 
statements geschreven. 

De DBH maakt gebruik van hieruit gecompileerde obiect versies. 


De DBH verzoekt het Operating System om de benodigde fysieke 
VO operaties uit te voeren, 


Het Operating System communiceert met het achtergrondgeheugen 
(secondary storage) , 


, De data vvorden door het Operating System opgeslagen in systeem- 


buffers. 


De DBH brengt de gevraagde data van de systeembuffers over 
naar het gebruikersprogramma in het gebruikersvverkgebied 
(UVVA — User VVorking Area), 


. Status informatie zoals foutindicaties, area naam en record naam 


vvorden door de DBH ook aan het gebruikersprogramma ter be- 
schikking gesteld in speciale registers. 


Het progxramma kan nu met de gegevens manipuleren. 


, Hetgeen in de systeembuffers staat, vvordt door de DBH biige- 


houden, aangezien de mogeliikheid bestaat dat ook andere pro- 
gramma.s van dezelfde gegevens gebruik vvillen maken. 


Een van de belangriyke eisen, gesteld aan een database system is, 

dat verschillende applicatie-processen de database geliiktiidig kunnen 
benaderen. Een van de functies van de database handler is dan ook, 
deze geliiktiidige benaderingen zodanig te reguleren en controleren, 

, dat de applicatie-processen elkaar d. m.v. vviizigingsacties in de 
database niet nadelig beinvloeden, 


Fig. 35 Schema van een DBH systeem met meerdere gebruikers. 
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Om bi) geliyiktiidig gebruik de mogeliikheden, die de database handler 
biedt, zo goed mogelifk te hanteren, dienen de applicatie-processen 
in het algemeen "transaction oriented" opgezet te vvorden. 

Dit past echter volledig in de moderne opvatting, dat processen zo- 
veel mogeliğk een afbeelding moeten ziin van de logische vervveerking 
der gegevens zoals de gebruiker zich die voorstelt. 


Een database handler reguleert en controleert alleen de benaderingen 
van een database. Bi/ real-time verveerking van gegevens, - en 
zeker vvanneer dit plaatsvindt met behulp van decentraal opgestelde 
terminals - is het ook nodig het berichtenverkeer tussen gebruiker 
(terminal) en het centrale systeem te regelen. 

Hiervoor vvordt dan een standaard programma component, de 
Message Handler toegepast. 

Deze ziet er op toe, dat een terminal of invoerstation met het ?uiste 
applicatie-proces vvordt verbonden. 

Maakt het applicatie-proces gebruik van een database, dan bliğkt dat 
vooral de controlerende functies van database handler en message 
handler veel met elkaar te maken hebben. m feite immers veordt 
een gebruiker via terminal en applicatie-proces met de database 

(de gegevens) verbonden. 

Om een en ander nu zo optimaal mogeliik te vervvezenliiken, is men 
er toe overgegaan de message handling en database handling te 
integreren: DB/ DC processing. 


Terminal A Terminal B Terminal C 


: - 


Message Handler componehit”— 


C 
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N 
x 
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Met een dergeliik systeem kunnen ook allerlei centrale beheersfunc- 
ties ten behoeve van de opgeslagen gegevens op eenvoudige vvilze 
vervvezenliikt vvorden. 

De systeembeheerder kan dan de beschikking hebben over een ter- 
minal van vaaruit hi) het gehele systeem beheert. 

Ook bestaat de mogeliikheid op het niveau van de applicatie-proces- 
sen centrale controles automatisch te laten verrichten zonder dat 
een individuele terminal gebruiker dit kan vermiiden. 


8.6 Database beheer 


Bii een geintegreerd informatiesysteem, vvelke gebruik maakt van 

een database, is het van belang dat het systeem aan ziifn doel blif/ft 

beantvvoorden. 

Dit kan vanuit tvvee gezichtspunten benaderd vvorden: 

- de beschikbaarheid van de iuiste informatie voor de fiuiste gebrui- 
kers, 

- de mogeliikheid met behulp van het geautomatiseerde systeem de 
informatie effici6nt te kunnen hanteren. 


Het eerste aspect heeft dus vooral te maken met de informatie zelf 
en de (logische) relaties tussen de informatie-eenheden. Het tvveede 
aspect richt zich vooral op de iuiste vverking van het database 
management systeem en de technische vervveezenlifking van de data- 
base, 

Om deze redenen onderscheidt men tegenvvoordig dan ook meer en 
meer tvvee beheersfuncties, te vveten: 

- data beheer of informatie beheer 

- database administratie. 


8.6.1 Data beheer 


De data beheersfunctie beheerst de feiteliike inhoud van een data- 
base. Dit houdt onder meer in: 


- Vaststellen van de feiteliike inhoud van de database. Hierbii is het 
van eminent belang, dat de data duideliik en eenduidig vastgelegd 
is. 

Standaardizering van data-omschriivingen spelen dan ook een 
belangriyke rol. 


- Beheer van de betrouvibaarheidsregels en toezien dat deze nage- 
leefd vvorden, 


De data beheersfunctie heeft als het vvare het gezag van een eigenaar 
van de database en vertegenvvoordigt de leiding van de organisatie in 
de database aangelegenheden. 
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8.6.2 Database administratie 


De database administratie functie is verantvvoordeliik voor de goede 

vverking van het database systeem, 

Dit houdt onder andere in dat: 

- de informatie zo efficiö6nt mogeliyk in de database is opgeslagen, 
en zo nodig gereorganiseerd vvordt, 

- de database beschikbaar is en technisch toegankeliik, 

- de database, na het optreden van een defect, vveer zo snel mogeliyk 
hersteld en beschikbaar İs, 

- statistische gebruiksgegevens verzameld vvorden en in het alge- 
meen gebruikseffici6ntie gemeten vvordt, 

- biğstand verleend vvordt aan gebruikers en programmeurs voor 
Tuiste benaderingsvviizen der database, 

- toegezien vvordt dat alleen uitgeteste en goedgekeurde programmas 
voor database benadering gebruikt vvorden. 


De database administratie vormt als het vvare de technische dienst 
voor een database systeem. 


8.6.3 Hulpmiddelen voor database beheer 


Een database management systeem dient ook een aantal hulpmiddelen 
te omvatten voor de uitoefening der beide beheersfuncties. 

Een data beheerder zal vooral behoefte hebben aan goede administra- 
tieve hulpmiddelen om de informatie eenduidig te kunnen omsehri/ven 
en de gebruiksregels vast te leggen. Hiervoor zi/n tegenvvoordig 

zgn. data dictionary/directory systemen beschikbaar, die (in het 
ideale geval) direct met een DBMS geihtegreerd kunnen vvorden. 

Een ander belangriik hulpmiddel ziin procedures om het gebruik van 
de informatie te autoriseren, 


Voor de database administrateur (DBA) ziin reeds meer hulpmiddelen 
voor handen. Hieronder vallen: 
- procedures voor herstel van databases, 
- procedures om integriteit en consistentie van databases na te gaan, 
- procedures om copieön van databases te kunnen maken, 
- procedures om het gebruik te meten, 
- procedures om (grote) delen van de database versneld te vullen əf 
te legen, 
- procedures om de structuur van de database te kunnen rapporteren, 
- procedures om een database te kunnen reorganiseren en, of te 
herstructureren, 
Reorganisatie beslaat de verandering van de fysieke opslag van 
de database, Herstructurering houdt in dat de logische structuur 
van de database verandert. 
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Ook allerlei testfaciliteiten ten behoeve van de database, het DBMS 
en de gebruikersprogramma. s vallen onder de hulpmiddelen voor 
een ?uiste database administratie. ı 


Vanzelfsprekend valt het beheer der diverse compilers voor DDL en 
DML talen binnen het gebied. Hierbii kan opgemerkt vvorden, dat 
een goed hulpmiddel om de relatie tussen subschema/s en de appli- 
catie-programma.)"s die daarop vverken, te registreren, dikvviils 
node gemist vvordt. 


8, 6.4 Database hersteltechnieken 


m de inleiding is al opgemerkt, dat het gebied van een database met 
zich meebrengt, dat een organisatie nogal afhankeliik kan vvorden 
van de goede vverking van het database systeem., 

Het is daarom zeer belangriik veel aandacht te schenken aan het 
voorkomen van fouten en storingen. 

Toch zal het optreden van fouten en storingen nooit geheel voorkomen 
kunnen vvorden. Hierbi) zal vaak de inhoud van de database defect 
raken of in ieder geval niet betrouvbaar meer ziyn. 


Om een dergeliike defecte database snel te kunnen herstellen is een 
eerste vereiste, dat hierop al van te voren geanticipeerd is: 


- Van tiğd tot ti/fd moet vastgelegd vvorden dat de database in een 
betrouvybare staat verkeert (check pointing). 


- Uitgaande van een dergeliyke situatie moeten alle veranderingen 
geregistreerd vvorden die op de database plaatsvinden (logging) . 


- Op geschikte momenten moet een betrouvbare copie van de data- 
base getrokken vvorden (back-up) , 


Bi? een defecte database ziin in principe tvvee herstelstrategie6n 
mogeliiğk. 


1, Uitgaande van de defecte database vvordt met behulp van de gere- 
gistreerde veranderingen de laatste betrouvbare staat gerecon- 
strueerd., Dit is een "achtervvaartse" reconstructie (back-out) . 


2. Uitgaande van een betrouvvybare copie, vvordt met behulp van de 
geregistreerde veranderingen de laatst bereikte betrouvibare 
staat opnieuvv gegenereerd. Dit is een "voorvvaartse" reconstructie 
(roll forvvard). 


Voor de achtervvaartse reconstructie dient van te veranderen gegevens, 
de toestand vöör de verandering bevvaard te vvorden. Een dergeliike 
afbeelding noemt men een "before-image"”, 

Uitsluitend de eerste before-image na de vastlegging van een 
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betrouvrbare toestand is nodig, daar deze de gegevensstaat van het 
moment van deze betrouvbare toestand vveergeeft, vvelke voor 
reconstructie nodig is. 


Voor de voorvvaartse reconstructie heeft men fuist de veranderde 
toestand nodig. Na iedere verandering vvordt de veranderde infor- 
matie gelogd. Dit vvordt een "after-image" genoemd. Bii/ de 
reconstructie heeft men iuist de laatste after-image vöör een vast- 
gelegde betrouvrbare toestand nodig, om deze betrouvbare toestand 
te kunnen reconstrueren. 


Beschouvv de figuren 37 tot en met 40, 

m een applicatie-proces vvordt een verschiiningsvorm van een record 
R1 tiğdens opeenvolgende integriteitseenheden gevviizigd. 

Tussen de eerste v/i/iziging en het daaropvolgende integriteitspunt 

IP2 moet een after-image R11 vvorden gemaakt om gebruikt te kunnen 


IP0 IPI IP2 IP3 
R10 R21 RI1 R12 R135 
V/YZ. I V/YZ V/YZ storing 
. v 
database after- before- R11 : versie 1 van record 1 
copie image image IP2 : integriteitspunt 2 
R11 R11 VVYZ: vviiziging van het 
record 


Fig. 37 Een applicatie-proces met logging. 


vvorden voor de voorvvaartse reconstructie naar IP2 zoals in figuur 
ƏS İS aangegeven. 


IP0 IPIı IP2 IP3 
R10 R11 R11 R12 R13 f 
X—————— —5— —— —  — ———.- --- 
. V/YZ i v V/YZ V/YZ storing 
l İ 
I after- , i 
v —.-image— 
r database —  “” R11 
Iİ copie 


qn € o € qx € oxu € omə € onu 8  7k—-—k” —“ —“" "Q —E6 € —OO€ 920 .5——UUHEI 


Fig. 38 Voorvvaartse reconstructie naar IP2, 


duist voor de tvveede vviiziging moet er een before-image van R11 
vvorden gemaakt, Deze versie, die geheel geliyk is aan het vorige 
after-image is nodig voor een achtervvaartse reconstructie naar 
IP2 zoals in figuur 39 is aangegeven. 


IP0 IP1 IP2 IP3 
R10 R11 RI1 R12 R13 a 
V/YZ V/YZ storing 
1 
Lİ I l İ 
database İ before- I 
copie 0-9 -image mə — o. —İ 
R11 


Fig. 39 Achtervvaartse reconstructie naar IP2, 


m biina alle gevallen dat er een storing optreedt kan de achtervvaartse 
reconstructie methode gebruikt vvorden. Alleen als het opslag medium 
besehadigd is en de inconsistente (of niet integere) database kan niet 
meer gelezen vvorden, kan er alleen van een database copie vvorden 
uitgegaan om met behulp van de voorvvaartse reconstructie methode 
te vvorden hersteld. Nadat de database gereconstrueerd is, kunnen 

de onderbroken transacties opnieuv/ begonnen vvorden, 


Het concept van de integriteitseenheden houdt in, dat voor ieder 
proces geldt, dat het laatste integriteitspunt als reconstructiepunt 
kan dienen zonder in synchronisatie moeiliikheden te vervallen. De 
lopende transacties immers hebben geen informatie kunnen hanteren 
die door een andere lopende transactie vvordt gemodificeerd. 


IP IP IP 
11 12 04. 12. 
Proces 1 527070x0”.” . — -- 
İB. 6 IP 
21 / 21 
Proces 2 ———I 0573 M 
“ 
m m. IP 
əl 0 əs 
Proces 3 ——X ——x——“x—ş- - - - -- -.—— 
storing herstart 
(IP — mtegriteits Punt) ——əİ 


Fig. 40 Automatisch herstel., 
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APPENDIX 1. 


Tabel: Capaciteiten en overdrachtsnelheden voor blokken 
zonder key (zr sleutel). 


overdrachtsnelheid 


octaden per blok blokken per in msec per blok 


minimum maximum cylinder module minimum maximum 


1741 3625 
1132 1740 
831 1131 
652 830 
533 651 
448 532 
385 447 


10 2000 11.16 23.24 
20 4000 7.26 11.15 
30 6000 5.33 7.25 
40 8000 4.18 5.32 
50 10000 3.42 4.17 
60 12000 2.87 3.41 
70 14000 2.47 2.87 
335 384 80 16000 2.15 2.46 
296 334 90 18000 2.14 
264 295 20000 

237 263 22000 

214 236 24000 

194 213 26000 

178 193 28000 

163 177 30000 

150 162 32000 

139 149 34000 

128 138 36000 

119 127 38000 

110 118 40000 

103 109 42000 

96 102 44000 

89 95 46000 

83 88 48000 

78 82 50000 
73 77 52000 


4000 OXU F- UÜ0Q) 
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octaden per blok blokken per overdrachtsnelheid 


in msec per blok 


minimun maximum spoor eylinder module minimum maximum 
68 72 27 270 54000 0.44 0.46 
64 67 28 280 56000 0.41 0.43 
60 63 29 290 58000 0.38 0.40 
56 59 30 300 60000 0.36 0.38 
53 Rə. 31 310 62000 0,34 0.35 
AŞ 52 32 320 64000 0.31 0.33 
46 48 33 330 66000 0.29 0.31 
43 45 34 340 68000 0.28 0.29 
41 42 35 350 70000 0.26 0.27 
38 40 36 360 72000 0.24 0.26 
36 37 37 370 74000 0.23 0.24 
33 35 38 380 76000 0.21 0.22 
31 32 39 390 78000 0.20 0.21 
28 30 40 400 80000 0.18 0.19 
26 27 41 410 82000 0.17 0.17 
24 25 42 420 84000 0 15 0.16 
22 43 430 86000 0.14 0.15 
44 440 88000 0.13 0.13 

45 450 90000 0.13 0.13 

46 460 92000 0.12 0.12 

47 470 94000 0.10 0.11 

48 480 96000 0.10 0.10 

49 490 98000 0.08 0.09 

50 500 100000 0.08 0.08 

51 510 102000 0.06 0.07 

52 520 104000 0.06 0.06 

53 530 106000 0.05 0.05 

54 540 108000 0.04 0.04 

55 550 110000 0.03 0.04 
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Tabel: C apaciteiten en overdrachtsnelheden voor blokken met key 
(- sleutel). 


octaden per blok blokken per overdrachtsnelheid 


in msec per blok 


minimum maximum spoor eylinder module minimum maximum 
1721 3605 1 10 2000 ıt. də... 
1112 1720 20 4000 və 11.03 
812 1111 30 6000 2.24 7.12 
633 811 40 8000 4.06 5.20 
513 632 50 10000 3.29 4.05 
429 512 60 12000 “753 3.28 
365 428 70 14000 2.34 2.74 
316 364 80 16000 2.03 2.33 
276 315 90 18000 . 2.02 
245 27$ 20000 
218 244 22000 
195 217 24000 
173 194 26000 
159 174 28000 
144 158 30000 
131 143 32000 
120 130 34000 
109 119 36000 
100 108 38000 
91 99 40000 
83 90 42000 
77 82 44000 
70 76 46000 
64 69 48000 
59 63 50000 
54 58 52000 


MV 005306 Əb Şu 03 
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overdrachtsnelheid 


octaden per blok blokken per 


in msec per blok 


minimum spoor eylinder module minimum maximum 


49 53 27 270 54000 0.31 0.34 
45 28 280 56000 0.29 0.31 
41 29 290 58000 0.26 0.28 
37 30 300 60000 0.24 0.26 
34 31 310 62000 0.22 0.23 
30 32 320 64000 0.19 0.21 
33 330 66000 0.17 0.19 
34 340 68000 0.15 0.17 
35 350 70000 0.13 0.15 
36 360 72000 0.12 0.13 
37 370 74000 0.11 0.12 
38 380 76000 0.09 0.10 
39 390 78000 0.08 0.08 
40 400 80000 0.06 0.07 
41 410 82000 0.04 0.05 


42 


420 84000 0.03 0.04 
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APPENDIX 2. 


V oordenliist 

Deze liist volgt de termen zoals ze achtereenvolgens in de paragra- 
fen van de syllabus voorkomen, ze dient vooral als hulpmiddel bi) 
het repeteren van de stof. 


Paragraaf: 

1 Obiect (entity, begrip, betekenisvolle eenheid) 
Kenmerk (property, gegevensklasse) 
Logische structuur 
Fysieke structuur (opslagstructuur) 


2.3 Logisehe bouvvsteen 
Character 
2.2 Ttem 


Naam item (attribuut, property, gegevensklassel 
V/aarde item (value, gegevensvvaarde) 
Veld (rubriek, field) 
2.3 Recordtype (entity) 
Sleutelitem (recordsleutel) 
VVifzer (pointer, reference) 
Blokken 
Secundair geheugensysteem 
Vastleggen items: Fixed 


Indexed 
Separator 
Label 
2.4 Multifile volume 
Multivolume file 
Databank 


File-activity (relatieve frequentie van bestandsreferenties) 
File-volatility 
File-turnover (vervangingsgraad) 


3.1 Sequenti6le structuur 
Boomstructuur 
Netvverkstructuur 

3.2 Lifststructuur, sliertstructuur (list) 


Enkelvoudige kettingstructuur (ketting in €€n richting) 
Dubbele kettingstructuur (ketting in tvvee richtingen) 
Ring kettingstructuur (circular list) 
Ə, Linear search (sequentieel zoeken) 
Full search 
Binair zoeken 
Skip-sequential (getraps sequentieel) 
Directe zoek 
Indirecte zoek 
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4 Blok 
Blokhiaat, gap (blockspace) 
Logical record (logisch record) 
Physical record 
Grootvader-vader-zoon-systeem 
Schiffziide 
Cilinder 
Spoor 
Batchvervver king (groepsgevviize vervverking) 
Schiivengeheugens 
Identificatie (key, sleutel) 
0.4 Index-sequentiöle organisatie (geindiceerd sequentiele org.) 
Sleutelvolgorde 
Cilindertabel (cilinderindex) 
Sporentabel (tracktable, spoorindex, trackindex) 
Volume-index 
Overloopsporen (overflovv area, overflovv gebied) 
Reorganiseren 
Normal-entry 
Overflovv-entry 
Ə.Ə Directe adressering 
Indirecte adressering 
5.3.1 Schiifadres 
Sleutel 
Disk-adres 
Relatieve adressering 
5.8.2 Randomizing (sleutelconversie of sleuteltransformatie 
procedure) 
Primair gebied 
Bezettingsgr aad 
Adresseringstechnieken 
Ciifer analyse tabel 
Extracting 
Folding (knippen) 
Vermenigvuldiging (midsquaring) 
Distribution method 
Home-address (huisadres, spoornummer) 
Binning 
Strook 
5.4 Postgevviis 
Groepsgevviis 
Deadlock 
Resource-sharing 
Accesstiid 
Relatieve bestandsorganisatie 
Inverted file structuren (geinverteerd bestand) 


Cı O1 
Cı 01 
Də -I 
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ö.0.3 


0.6 


Cə Gə €? o 
Əə 


Qı He co 


Liiststructuren 

Keten vrifie plaatsen 

Boom met meerdere 

Niveaus 

Produktstructuurbestand 
Gerelateerde informatie 

Forvard chain 

Dovvnvvard chain 

Backvvard chain 

Upvvard chain 

Toevoegen in een ketting 
Masterrecord 

Verviisadres 

Gesegmenteerde records 

Master and detail records 
Informatie segmenten 

Sequenti6le organisatie 
Index-sequentiele organisatie 
Direct toegankeliike organisatie (random organisatie) 
Blokken 

Ontblokken 

Parallel buffering (parallel vervveerking) 
Achtergrondgeheugen 

Primair geheugen 

Sleutelvvaarden 

Bestandsbeveiliging 

Grootvader, vader, zoon-systeem 
Dump 

At random vervverken 
Bestandsontvverp 
Bestandsdynamiek 

Splitting files 

Processing eycle files 

Prime files 

Trailer files 

Split files 

File turner 

File activity 

File volatility 

Hoofdbestand (master file, permanent bestand) 
Gerelateerd bestand (related file) 
Geinverteerd bestand (inverted file) 
Transactiebestand (transaction file) 
Inputbestand 

Mutatiebestand 

Inquiry record 

Activity record 


6.3 


6.4.1 


6.4.2 


6.4.3 


Outputbestand 

Historisch bestand 
Totaalbestand 

Summary file 

Recovery bestand 

Backup bestand 

Data base 

Primair bestand 

Trailer bestand 

Data Base Handler 

Data Language 

Partitioned bestand 
Members 

Catalogus (directory) 

File consolidation 
Bestandsnazorg 

File maintenance 
Veldontvverp (field design) 
Record compaction 

Sector 

Spoor 

Decimal scaling 

Floating point 

Variabele lengte velden 
Bitting 

Coding 

Heading 

Substituering 

Collating sequence 

Minor sorteerveld 

Maior sorteerveld 

Limiet van het bestand 
Data management softvare 
Fysisch record 
Interrecord gaps 
Accesstiid 

Identificatie records (header label) 
File control . 
Controle van het bestand 
Interne controle 

Positieve controlemiddelen 
Negatieve controlemiddelen 
Ingebouvvde controles 
Machine gerichte controle 
Hardvvare controles 

Hole count 

Protectiöring 
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160 


1... 


— -ı 
Co Co 


T7,3.2 


8.2. 


2 


1 


Pariteitscontrole 

Overflovv 

Geheugenprotectie 

House keeping 

Header-label 

Bevvaartermiin 

Haspelnummer 

Volledigheid controle 

Block totals 

Record totals 

Hash totals 

Trailer label 

Utility progxrams 

Sluitkaart 

Sluitblok 

C heckpoint 

Restart 

Read after vrite 

Read errors 

VVrong length record 
Geprogrammeerde controles 
Invoercontroles 

Plaatscontrole 

Limietcontrole 
Volgordecontrole 
Geldigheidscontrole 
Afhankeliikheidscontrole 
Volledigheidscontrole 
Self-checking codes 
Vierkantscontrole 

Audit trail 

Cross footing 

Leap-frog 

Database 

Database systeem 

Database management systemen (DBMS) 
Codasyl DBTG 

Gastheertaal (host language) 
Gastheertaal systeem 
Selfcontained systeem 

Data Definition Language (DDL) 
Device Media Control Language (DMCL) 
Data Manipulation Language (DML) 
Entiteit 

Entiteittype 

Verschiiningsvorm (occurrence) 
Entiteitenmodel 


8.2.2 


8.2.4 


8.2.5 


—. 
. 
cə 


Hə 


05275 


go ço go go go go 
o 1 Hö 6 19 — 


oo 
o 

.. 
bo 


Eigenschap (attribute, property) 
Eigenschaptype 
Eigenschapsvvaarde 

mformatie 

Relatie 

Data-item 

Data-agxgregate 

Record 

Vector 

Repeterende groep 


7 Set verschiiningsvorm 
Bachman-diagram 
Gegevensstructuur (data structure) 
Schema. 

Sequentiele structuur 
Boomstructuur 
Netveerkstructuur 
Automatic membership 
Manual membership 
Mandatory membership 
Optional membership 
Area 

Exclusive access 
Protected access 

Search key 

Fysieke opslag 

Database key 

Chaining 

Pointer array 

Fysiek sequentieel 
Storage Structure Language (SSL) 
Betrouvpbaarheid (reliability) 
Availibility 
Geheimhouding (privacy) 
Veiligheid (security) 
Accuratesse (accuracy) 
Integriteit (integrity) 
Consistentie (consistency) 
Subsechema. 

Subsechema DDL 
Sequentiele accessvorm 
Directe accessvorm 
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8.5.3 Gemeenschappeliğ)k gebruik (concurrent use) 
Transactie 
mtegriteitseenheid 
Deadlock 
Exclusieve toegang (exclusive access) 
Beschermde toegang (protected access) 
8. 5.4 DML 
Open 
Close 
Find 
Modify 
Store 
Delete 
msert 
Remove 
Move 
8.5.5 Database Handler (DBH) 
User VVorking Area (UVVA) 
Message handler 
DB/DC processing 
8, 6.4 Check pointing 
Logging 
Back-up 
Before image 
After image 
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APPENDIX 3. 


Opgaven 


1. Gegeven een tape, 800 bytes/inch, 2400 feet lang, lengte van in- 
terrecord gap: 0.6 inch. 
Stel vve hebben een bestand met logische records van vaste lengte 
(200 karakters per record), tervvi/l de blokkingsfactor 5 is. 
Bereken hoeveel logische records deze tape bevatten kan, als 
men vveet dat 30 feet gereserveerd is voor header- en trailer- 
label. 


2. Gegeven een disk-pack, met 200 cilinders, 20 tracks per cilin- 
der, 7294 bytes per track, rotatiesnelheid 25 msec. 
Gegeven een bestand, bestaande uit 10.000 records, 200 bytes 
per record. 


a. Als vve 23 records/track vvensen, hoeveel cilinders beslaat 
dit bestand dan? 


b. Stel dat het bestand sequentieel ligt opgeslagen vanaf cilinder 
0, track 0, hoeveel accessbevvegingen ziin dan nodig om de 
gehele file sequentieel af te vverken? 


c. Het antvvoord op vraag b toont aan dat accesstiid vervvaarloos- 
baar is bii sequenti6le afvverking. De meeste tiid kost dan de 
rotatie en de data-overdracht. 

Als vve voor elk record een volledige omvventeling rekenen, 
hoeveel kost dan het lezen van de gehele file? 


De volgende opgaven betreffen een bestand met 10.000 logische re- 
cords, elk record bevat 160 karakters (lengte — 160 bytes of octa- 

den), daarbii inbegrepen een 7-byte sleutel. 

Het opslagmedium is een schiivengeheugen met de volgende eigen- 
schappen (1BM 2311): 


aantal cilinders : 200 

aantal sporen per cilinder : 10 

aantal bytes (char) per spoor: 3625 
gemiddelde accesstiid : 75 msec. 
duur van een rotatie : 25 msec, 
overdrachtssnelheid : 156 kbytes 


Zie ook de tabel op de volgende bladziide. 

De kolom met (K) betekent: "formatted vvith key", de andere kolom 

betekent: "formatted vvithout key". 

Records vvorden veelal op tvvee manieren op een spoor gerepresen- 

teerd: 

- naast administratieve informatie over plaats en lengte van het 
record vvorden de gegevens fysisch als een geheel opgeslagen 
(formatted vvithout key), 
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Max. bytes per Records per Max. bytes per 
un track record (K) 


1 
2 
Ə 
4 
Ə 
6 
7 
8 
9 


Tabel 1: Tabel voor spoorcapaciteit. 


- aan de administratieve informatie vvordt de sleutel van het record 
toegevoegd, de gegevens van het record vvorden vveer als een ge- 
heel opgeslagen (formatted vvith key). 


Voor fysische records met een lengte kleiner dan aangegeven in de 
tabel hierboven kan men gebruik maken van de volgende formules: 


B- benodigde hoeveelheid - 61: Ə37 x DL (formatted vvithout 
bytes voor een record 512 key) (1) 

pu benodigde hoeveelheid - 814: 537 x (DL:KL) (formatfted vith 
bytes voor een record 512 key) (2) 
.. benodigde hoeveelheid —. (formatted vvithout 
bytes voor het laatste record key) (3) 

— benodigde hoeveelheid 3 (formatted vvith 
ə bytes voor het laatste record a key) (4) 


De getallen geven de benodigde ruimte voor gaps en administratie 
vveer. 

DL “ data length — aantal bytes van het record. 

KL — key length “ aantal bytes van de sleutel., 


ə, Het bovengenoemde bestand is sequentieel georganiseerd. 


a. VVat is de optimale blokkingsfactor als vve een blok niet groter 
dan 1000 bytes villen maken? 
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, Hoeveel cilinders beslaat de file bi) deze blokkingsfactor ? 


c. Hoeveel tiyd kost het sequentieel lezen van de file? (Ga er 


d. 


van uit dat elke leesopdracht een omvventeling kost, dit is aan 
de hoge kant.) 


Hoeveel tiid kost het random lezen van 5000 records? 


4. Het bovengenoemde bestand is nu index-sequentieel georganiseerd, 
blokkingsfactor is vveer 5, bestand kriygt een aaneengesloten stuk 
geheugen. 

De biigeleverde standaard softvvare heeft de volgende eigenschap- 
pen: 


per cilinder is een track gereserveerd voor overflovv, 

bi? elke cilinder (is) ziin de eerste track(s) gereserveerd voor 
de track-index, 

elke track-index bevat als eerste record een set gegevens die 
de overflovv controleert (COCR), vervolgens bevat de track- 
index paren entries (een voor primaire spoor, een voor over- 
loop vanuit dit spoor). 

Elke entry geeft vveer: adres van de track, hoogste sleutel- 
vvaarde op die track. 

Adres van de track: 10 bytes 

Sleutelvvaarde : door gebruiker op te geven, 

elke track-index vvordt afgesloten door een dummy-entry (ge- 
vuld met "nep"-adres en "nep"-sleutel) als eindsymbool, 
cilinder-index heeft dezelfde opbouvv als de track-index, 


- bi) geblokte records vvordt de hoogste sleutel van de logiseche 


on Öp 


eb, 


records in het blok als sleutel van het blok beschouvvd en hier- 
aan toegevoegd, 

overflovv records ziiln niet geblokt, 

aan een overflovv record vvordt vervviisadres (10 bytes) toege- 
voegd. 


. Hoeveel logical records passen op een primair spoor? 


Hoeveel logical records passen op een overflovv spoor ? 


Hoeveel primair sporen bevat een cilinder? 


. Hoeveel entries zal de track-index bevatten, afgezien de COCR? 


. Hoeveel bytes ziin nodig voor de index-entries voor elke track- 


index (gebruik de hierboven gegeven formules)? 


. Hoeveel logical records passen nog op de tracks, die de track- 


index bevatten? 


. Afgezien van cilinder-index en overflovv-area, hoeveel cilin- 


ders heeft deze file nodig? 


Hoeveel entries zal de cilinder-index bevatten? 
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m. 


, Hoeveel sporen heeft de cilinder-index nodig? 


, Hoeveel disk-tiid kost het sequentieel lezen van de file (neem 


aan dat de overflovv-area voor de helft gevuld is)? 


, Hoeveel disk-tiid is nodig om 5000 records random te lezen? 


(Cilinder-index is niet in het kerngeheugen, maar vvordt met 
hetzelfde accessmechanisme gelezen als de rest van de file.) 


. Hoeveel disk-tiid is nodig om 5000 records te lezen als de ci- 


linder-index door een ander accessmechanisme gelezen kan 
vvorden als de rest van de file? 


Hoeveel disk-tiid is nodig om 5000 records te lezen als de ci- 
linder-index in het kerngeheugen is? 


o, Het bestand is nu "direct toegankeliik" georganiseerd. 
De records ziiyn niet geblokt en "formatted vvith key" opgeslagen. 
De bezettingsgraad van het primaire gebied mag niet hoger dan 
8570 zi)n. 
De adressering is indirect. De overflovv is niet gebaseerd op sy- 
noniemketens, maar vvordt opgevangen door synoniemen zo dicht 
mogeliiğk bii het berekende adres te plaatsen. 


a. 
b. 


Cc, 


Hoeveel cilinders heeft deze file nodig? 


Hoeveel disk-tiğd is nodig om de file sequentieel te vervverken? 
(Neem aan dat een adrestabel gebruikt is en dat het 1 zoekop- 
dracht en 1.2 leesopdrachten kost om elk record te vinden.) 


Hoeveel disk-tiid is nodig om 5000 records random te lezen? 


6. Vergeliğyk door opgave 3, 4 en 5 te beschouvven de drie bestands- 
or ganisatietechnieken ten aanzien van geheugenbeslag en verver- 
kingssnelheid bi) sequenti£€le en directe vervverking. 
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Antvoorden bii opgaven 


1. Dichtheid : 800 bytes/inch—0.00125 inch/kar. 
Tapelengte : 2400 x 12 — 28800 inch. 
Voor informatie beschikbaar: 28800 - (12 x 30) — 28440 inch. 
Per blok nodig: gaplengte -“ aantal kar/blok s inch/kar — 0.6 HF 
0.00125 x N. N 5 x 200 — 1000 kar. 
6. 15.373 blokken bevatten 
0.6-40.00125x1000 : : 
Dit is 5 x 15.373 — 76.865 logische records. 


Formule: 


. tapelengte 
Aantal blokken -“ lengte gap -- lengte kar. x aantal kar /blok 


2, a. 10.000/23 — 435 tracks, 


Tape kan 


435/20 x 22 cilinders. 
b. 21 bevvegingen kx 25 msec. “ 525 msec. 
. — 250. 000 : 
c. (10.000 x 25) € 250.000 msec. € 60.000 7 4.2 min. 


3. a. VVe kunnen kiezen uit blokkingsfactoren 1, 2, 3, 4, 5, 6, die 
alle bloklengtes - 1000 bytes opleveren. 
De tabel op pagina 149 leert dat de blokkingsfactoren 4 en 5 
(640 en 800 bytes per fysisch record) beide 20 logische records 
per spoor opleveren. (1mmers bi/ 640 bytes kan een spoor 5 en 
bii 800 bytes 4 fysische records bevatten.) 
VVe kiezen 5, omdat een hogere blokkingsfactor gunstiger is 
(buffergebruik, vermindering gaps, etc.). 


b. 10.000/20 “ 500 sporen “ 500/10 50 cilinders. 


c, Zoekehn: (geschiedt sequentieel— min. accessti)d) 


D0 kx 25 msec. z 1250 
Lezen: 10.000/5 — 2000 blokken 
2000 25 msec. x D0.000 


51.250 msec, — 51.250/60.000 — 0.9 min. 


d. Gemiddeld genomen zal voor het zoeken van elk record het 
halve bestand gelezen moeten vvorden. 
Per record is dit: 51.250/2 — 25.625 msec. /record. 
Totaal: 5.000 x 25.625 € 128.125 sec. € 35.6 uur. 


4, a. Bloklengte — 5 x 160 - 7 (sleutellengte, hoogste sleutel van 
records uit blok toevoegenl). 
x 807. 
Tabel 1 leert: 4 van deze fysische records per spoor. 
Dus: 20 logische records. 
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b. Overflovv records ziin ongeblokt. 
Bloklengte — 160 -- 7 (sleutel) 4“ 10 (verviisadres) — 177. 
Tabel 1 leert: 13 van deze records per track (kiik bii for- 
matted vith keyl). 
Dus: 13 logische records. 


c. 10 sporen per cilinder - 1 SpooT voor track-index - 1 spoor 
voor overflov “ 8, 


d. 2 entries voor records op het stuk dat overbliift achter de 
track-index. 
8 x 2 voor de records op de primaire sporen. 
1 dummy entry (afsluiten track-index) 
19 entries. 


e. Gebruik formule 2 (formatted vvith key). 
Track-index entries zi)n in feite ook records: 
sleutel — hoogste sleutel op dat spoor 


data “ adres van het spoor. 
Index-entry kost 81 4 —- - 98 bytes (DL “ 10, K - 7. 


Totaal 19 x 98 — 1862 bytes. 


f. Spoorcapaciteit: 3625. 
Over 3625 - 1862 (index grootte) — 1763 bytes. 
1 blok z 5 x 160 H 7 — 807 bytes. Er kunnen er dus hooguit 2 in. 
Nagaan: 


Formule (2) met DL - 800 en KL - 7: 81 4 — — 927 bytes. 
Formule (4) (laatste record) : 20 —7 4 800 — 827 bytes. 


927 r 827 € 1754 bytes. Kan er in. 
Du s: 10 logische records passen nog in spoor van de track- 
index, 


g. (20 x 8) 4.10 — 170 logische records per cilinder. 
10.000/170 “ 59 cilinders. 


h. 60 entries: 1 voor elke cilinder 4 dummy entry. 


i. Entry bestaat uit sleutel (KL “ 7) en adrescilinder (DL — 10) 
met formules (2) en (4): 
index-entry 81 - Ə5TUD - əş 
laatste entry € 20 4 7 4 10 - 37. 
Een track bevat dan: 
1 cap. track - aantal bytes voor laatste record 
aatste record 4 
aantal bytes voor een record 
9625 - 37 37 
98 : 
Een track bevat 37 entries. 
De cilinder-index (60 entries) past dus op 2 sporen. 


In dit geval: 1 4 
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1. Overflov/ ruimte voor deze file bevat 59 sporen (1 per cilinder), 
per spoor 13 records —59 x 13 — 767, 
De helft zou bezet ziin: £ 400 records. 
Gaan vve vervolgens niet uit van 9.600 records, maar 10.000, 
dan levert dit 2.000 fysische records op. 
Nemen vvee vveer aan dat lezen een volle rotatie kost: 
- 2000 x 25 Hr 400 x 25 “ 60.000 msec. 
- zoeken en lezen van een paar entries uit de track-index: 
10 x 59 x 12.5 € 7375 msec. 
- zoeken van de volgende cilinder: 59 ” 25 — 1475 msec. 
Totaal: 68850 msec. “ 1.15 minuten. 


k. Zoeken van cilinder-index : 75 msec. (gem. accessti)d) 
Zoeken van de cilinder : 75 msec, 
Lezen van de track-index entry: 12.5 msec. 
Lezen van cilinder-index entry : 12.5 msec. 
Lezen van record :258 msec, 
200 msec. 
5. 000 x 200/60.000 — 16.6 minuten. 


1. Dit scheelt bii het zoeken van de cilinder-index, ie kunt access 
daarop instellen: 


zoeken van de cilinder . 70 - mösç: 
lezen track-index entry : 12.5 msec. 
lezen cilinder-index entry : 12.5 msec. 
lezen van record :25 msec, 


125 msec. 
125 msec. x 5.000/60.000 — 10.4 minuten. 


m. Dit schakelt ook nog het lezen van de cilinder-index entries uit: 


zoeken cilinder :75 msec, 
lezen track-index entry : 12.5 msec. 
lezen record : 25 msec., 

112.5 msec. 


112.5 x 5.000/60.000 — 9,38 minuten. 


. a, Bezettingsgraad: 8590— £ 11765 locaties voor records ziin 
nodig. 

Per track kunnen vve 14 records kvvift (immers 1 record: 
160 F 7 — 167 bytes, een track kan er dan 14 bevatten (zie 
tabel 1)). : 

Dit levert: 11. 765/14 —841 tracks : 841/10 —85 cilinders. 


b. Per record: zoek : 75 msec, 4 
lezen: 1.2 x 25 — 30 msec. — 105 msec. 
Voor de gehele file: 105 r 10.000/60.000 — 17.5 minuten. 


c. Per record : 105 msec. 
Voor 5.000 records: 105 ” 5.000/60. 000 — 8.75 minuten. 
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benodigde aantal cilinders 


benodigde ti)d voor sequenti6le 
vervverking van de gehele file 
(minuten) 


benodigde tiğd voor random- 
vervverking van 5.000 records 
(minuten) 9.38-416.6” 


kAfhankeliğik van plaats van cilinder-index. 
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